
类型:七日精选
图片来源:网络
图片来源:网络

ODD 编辑组
从世界发现故事、思考和专业知识。
2025年3月10日
#004 AI文本生成的“扩散”之路与一本泛黄的启示
#004 AI文本生成的“扩散”之路与一本泛黄的启示
本期精选一本2011旧书带来的思考,呼应杭老师的提问;资讯重点解读扩散大语言模型,以迭代细化方式重新定义文本生成;并关注Manus Al从 MArtifacts 到 Deep Research 的技术整合进展。
本期精选一本2011旧书带来的思考,呼应杭老师的提问;资讯重点解读扩散大语言模型,以迭代细化方式重新定义文本生成;并关注Manus Al从 MArtifacts 到 Deep Research 的技术整合进展。
📰 本周值得关注的资讯
世界再一次变天!扩散大语言模型:重新定义AI文本生成的未来
与传统的自回归(AR)语言模型不同,扩散大语言模型采用了全新的生成机制。它从随机的"噪声"文本开始,通过一系列迭代步骤,逐步细化和完善内容,最终生成高质量的文本输出。这种方法类似于艺术家的创作过程:先勾勒出粗略轮廓,然后不断修改完善,最终呈现精美作品。
世界再一次变天!扩散大语言模型:重新定义AI文本生成的未来
与传统的自回归(AR)语言模型不同,扩散大语言模型采用了全新的生成机制。它从随机的"噪声"文本开始,通过一系列迭代步骤,逐步细化和完善内容,最终生成高质量的文本输出。这种方法类似于艺术家的创作过程:先勾勒出粗略轮廓,然后不断修改完善,最终呈现精美作品。

解构Manus Al:MArtifacts到Deep Research,Manus的技术创新和整合有哪些?
从 2025 年开始,AI要卷的不再是「思考」能力,而是「行动」能力,这也是「十字路口」。在它之前,领先模型公司中唯一做过这个尝试的是谷歌。在2024年12月12日,谷歌推出Gemini的同时,也推出了一个Agent系统Project Mariner。可以同时完成获取表单、找到公司官网、联系方式等多步骤任务,Agent会自动执行在谷歌搜索中查找电子邮件的过程,且这一过程中用户可以随时点击暂停和停止。同时,用户可以看到Agent每一步行动的推理步骤和计划。
解构Manus Al:MArtifacts到Deep Research,Manus的技术创新和整合有哪些?
从 2025 年开始,AI要卷的不再是「思考」能力,而是「行动」能力,这也是「十字路口」。在它之前,领先模型公司中唯一做过这个尝试的是谷歌。在2024年12月12日,谷歌推出Gemini的同时,也推出了一个Agent系统Project Mariner。可以同时完成获取表单、找到公司官网、联系方式等多步骤任务,Agent会自动执行在谷歌搜索中查找电子邮件的过程,且这一过程中用户可以随时点击暂停和停止。同时,用户可以看到Agent每一步行动的推理步骤和计划。

阿里推出媲美 DeepSeek-R1 的新推理模型
3月6日,阿里通义千问大模型团队最新发布并开源推理模型QwQ-32B。据团队介绍,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在数学、代码及通用能力上实现了质的飞跃,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。同日,全球最大的AI开源社区Hugging Face更新了大模型榜单,QwQ-32B成功登顶。
阿里推出媲美 DeepSeek-R1 的新推理模型
3月6日,阿里通义千问大模型团队最新发布并开源推理模型QwQ-32B。据团队介绍,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在数学、代码及通用能力上实现了质的飞跃,并突破性地让高性能推理模型在消费级显卡上实现本地部署,大幅降低了模型应用成本。同日,全球最大的AI开源社区Hugging Face更新了大模型榜单,QwQ-32B成功登顶。

小鹏 Iron L3 级人形机器人明年量产,已在广州工厂投入使用IT之家
3 月 9 日消息,据极目新闻报道,3 月 8 日,何小鹏首次现身代表通道,他透露小鹏 Iron 人形机器人已在广州工厂投入使用,并计划于 2026 年实现 L3 初阶能力的量产。在另外一个领域,华为也称在今年会发布 L3 级别的自动驾驶产品。
小鹏 Iron L3 级人形机器人明年量产,已在广州工厂投入使用IT之家
3 月 9 日消息,据极目新闻报道,3 月 8 日,何小鹏首次现身代表通道,他透露小鹏 Iron 人形机器人已在广州工厂投入使用,并计划于 2026 年实现 L3 初阶能力的量产。在另外一个领域,华为也称在今年会发布 L3 级别的自动驾驶产品。

回顾 2025MWC!AIOS 席卷手机 PC,国王点赞荣耀华为,中国企业霸场
今年好像挺多折叠产品的,传音也出了三折叠手机、三星出了竖向 3 折的直屏手机,联想则推出了折叠的 pc,另外还有 AR 眼镜和机器人。荣耀发布AI 战略,小米把人车家生态搬到了展厅,而 VO(在我这里 V 就是排在前面的)今年都没有参加。
回顾 2025MWC!AIOS 席卷手机 PC,国王点赞荣耀华为,中国企业霸场
今年好像挺多折叠产品的,传音也出了三折叠手机、三星出了竖向 3 折的直屏手机,联想则推出了折叠的 pc,另外还有 AR 眼镜和机器人。荣耀发布AI 战略,小米把人车家生态搬到了展厅,而 VO(在我这里 V 就是排在前面的)今年都没有参加。

谷歌推出全新的 AI 搜索模式
由 Gemini 2.0 提供“这种新的搜索模式扩展了人工智能概述的功能,具有更先进的推理、思考和多模态能力,因此即使是最棘手的问题,你也能得到帮助。你可以提出任何你想到的问题,并得到一个由人工智能提供的有用回答,并且可以通过后续问题和有用的网页链接进一步深入了解。”
谷歌推出全新的 AI 搜索模式
由 Gemini 2.0 提供“这种新的搜索模式扩展了人工智能概述的功能,具有更先进的推理、思考和多模态能力,因此即使是最棘手的问题,你也能得到帮助。你可以提出任何你想到的问题,并得到一个由人工智能提供的有用回答,并且可以通过后续问题和有用的网页链接进一步深入了解。”

Circular Ring 2 可能会让你扔掉你的智能手表
戒指延续了之前 Ring Slim 版本对各种指标的追踪,如日常活动、血氧水平(SpO2)、能量水平、消耗的卡路里、心率、呼吸频率、睡眠质量和干扰情况、心率变异性(HRV)、快速眼动周期以及入睡/醒来时间。它还具有月经周期追踪、体温监测功能,以及与生育、更年期和整体健康相关的洞察。至于充电方面,可以看一看你的 Airpods 是怎么解决问题的
Circular Ring 2 可能会让你扔掉你的智能手表
戒指延续了之前 Ring Slim 版本对各种指标的追踪,如日常活动、血氧水平(SpO2)、能量水平、消耗的卡路里、心率、呼吸频率、睡眠质量和干扰情况、心率变异性(HRV)、快速眼动周期以及入睡/醒来时间。它还具有月经周期追踪、体温监测功能,以及与生育、更年期和整体健康相关的洞察。至于充电方面,可以看一看你的 Airpods 是怎么解决问题的

Android 16 将支持实况通知
不得不说,安卓现在也是越来越保守了,基本都是看着市场成熟的东西拿一拿收入规范。从导航手势到实况通知,大家都做烂了谷歌才进来做规范,建议谷歌把小窗也纳入规范,大家都用那么。
Android 16 将支持实况通知
不得不说,安卓现在也是越来越保守了,基本都是看着市场成熟的东西拿一拿收入规范。从导航手势到实况通知,大家都做烂了谷歌才进来做规范,建议谷歌把小窗也纳入规范,大家都用那么。

📒 本周值得读的文章
算力普及时代,高通如何用“终端侧AI”重新定义行业规则?
近期,作为始终引领终端侧 AI 发展的企业,高通发布了《AI 变革正在推动终端侧推理创新》的白皮书,文章从技术突破、行业变革、生态布局三个层面解读白皮书的核心观点。
Duolingo 的工作原理手册
一家拥有 800 多名员工、市值约 160 亿美元的公司。《Duolingo 手册》通过成功、失败和一路走来的意外故事,记录了我们的5个核心原则。、一个覆盖年龄广泛全球性的教育应用的成功,其中必有对人性的深刻理解并运用在他们的设计哲学里,或许可以了解一下。
算力普及时代,高通如何用“终端侧AI”重新定义行业规则?
近期,作为始终引领终端侧 AI 发展的企业,高通发布了《AI 变革正在推动终端侧推理创新》的白皮书,文章从技术突破、行业变革、生态布局三个层面解读白皮书的核心观点。
Duolingo 的工作原理手册
一家拥有 800 多名员工、市值约 160 亿美元的公司。《Duolingo 手册》通过成功、失败和一路走来的意外故事,记录了我们的5个核心原则。、一个覆盖年龄广泛全球性的教育应用的成功,其中必有对人性的深刻理解并运用在他们的设计哲学里,或许可以了解一下。
🍚 本周的下饭信息
苹果承认 Siri 新功能开发推迟,苹果称“这些新功能的开发「需要比预想更长的时间」,预计将在「明年」才能向用户推出。”
OpenAI 前首席科学家 Ilya Sutskever 所创立的 Safe Superintelligence(SSI)公司已跻身全球最具价值的科技企业之列。在去年底罕见的公开演讲中,Ilya 讨论了他正在努力开发的超级智能,指出这类系统可能是不可预测的、具有自我意识的,甚至可能要求自身权利。
近日,Moonpig 公司的 AI 主管 Peter Gostev 最近发现,OpenAI 最新的 GPT-4.5 模型展示出超强的图像地理位置识别能力,即使是背景极其模糊、几乎看不清任何细节的照片,它也能准确识别出拍摄地点。
小米生态链征集女性产品需求,网友喊话美容仪、化妆镜、脱毛仪等
Apple 论文:面向人工智能驱动的非手动标记手语生成
苹果承认 Siri 新功能开发推迟,苹果称“这些新功能的开发「需要比预想更长的时间」,预计将在「明年」才能向用户推出。”
OpenAI 前首席科学家 Ilya Sutskever 所创立的 Safe Superintelligence(SSI)公司已跻身全球最具价值的科技企业之列。在去年底罕见的公开演讲中,Ilya 讨论了他正在努力开发的超级智能,指出这类系统可能是不可预测的、具有自我意识的,甚至可能要求自身权利。
近日,Moonpig 公司的 AI 主管 Peter Gostev 最近发现,OpenAI 最新的 GPT-4.5 模型展示出超强的图像地理位置识别能力,即使是背景极其模糊、几乎看不清任何细节的照片,它也能准确识别出拍摄地点。
小米生态链征集女性产品需求,网友喊话美容仪、化妆镜、脱毛仪等
Apple 论文:面向人工智能驱动的非手动标记手语生成
继续阅读



