
类型:七日精选
图片来源:网络
图片来源:网络

ODD 编辑组
从世界发现故事、思考和专业知识。
2025年3月31日
#007 春日诗意与AI共创
#007 春日诗意与AI共创
一是对ヨルシカ《春泥棒》的诗意推荐,用“留白美学”与“视觉韵律”呼应深度聆听;二是对 GPT‑4o 等生成式 AI 图像能力的亮点展示,强调人机共创与视觉迭代的边界扩张。整体气质在文化审美与技术进步之间取得平衡,体现当下设计语境下的感性与算法协作。
一是对ヨルシカ《春泥棒》的诗意推荐,用“留白美学”与“视觉韵律”呼应深度聆听;二是对 GPT‑4o 等生成式 AI 图像能力的亮点展示,强调人机共创与视觉迭代的边界扩张。整体气质在文化审美与技术进步之间取得平衡,体现当下设计语境下的感性与算法协作。
📰 本周值得关注的资讯
DeepSeek 发布 V3 更新:代码和审美有了质的提升
3 月 24 日晚,DeepSeek 在 Hugging Face 平台更新了 DeepSeek-V3-0324 模型。该模型在前端代码生成能力和审美方面有质的提升,被网友认为可媲美 Claude 3.7Sonnet,编码能力接近 Claude 3.7。主要更新包括上下文窗口达 128k、代码能力提升、审美跟上且免费开源可商用。模型参数 685B,采用混合专家系统架构,在数学、代码、逻辑推理、知识问答等方面表现优秀。
DeepSeek 发布 V3 更新:代码和审美有了质的提升
3 月 24 日晚,DeepSeek 在 Hugging Face 平台更新了 DeepSeek-V3-0324 模型。该模型在前端代码生成能力和审美方面有质的提升,被网友认为可媲美 Claude 3.7Sonnet,编码能力接近 Claude 3.7。主要更新包括上下文窗口达 128k、代码能力提升、审美跟上且免费开源可商用。模型参数 685B,采用混合专家系统架构,在数学、代码、逻辑推理、知识问答等方面表现优秀。

GPT-4o 更新,P 图火到 GPU 融化!官方开始限流
动动嘴就能P图创作,取代复杂工作流。如果把 GPT-4o 比作一个知识渊博,又有理性的设计师,那么 Stable Diffusion 还仅局限于美工的程度。GPT-4o 生成的图像中可以看出 AI 是能够理解你生成图片背后想要表达的含义。这说明 GPT-4o 的绘图能力源自 LLM 本身,并不是像以前那样简单地调用专门的生图模型(Dall-E)。对于输入的内容足够理解,也就是我们用自然语言就能控制 AI 帮助我们画图。轻松获得人们构想的效果,具备完美的风格一致性图像。
GPT-4o 能力实测:GPT-4o生图功能,实测很强,20+场景示例&缺陷整理
GPT-4o 更新,P 图火到 GPU 融化!官方开始限流
动动嘴就能P图创作,取代复杂工作流。如果把 GPT-4o 比作一个知识渊博,又有理性的设计师,那么 Stable Diffusion 还仅局限于美工的程度。GPT-4o 生成的图像中可以看出 AI 是能够理解你生成图片背后想要表达的含义。这说明 GPT-4o 的绘图能力源自 LLM 本身,并不是像以前那样简单地调用专门的生图模型(Dall-E)。对于输入的内容足够理解,也就是我们用自然语言就能控制 AI 帮助我们画图。轻松获得人们构想的效果,具备完美的风格一致性图像。
GPT-4o 能力实测:GPT-4o生图功能,实测很强,20+场景示例&缺陷整理

Reve1.0冲上生图模型第一,主打照片集真实感
Reve 是一家致力于人工智能图像生成技术开发的公司,其最新推出的模型是 Reve Image 1.0,也被称为 Halfmoon。这个模型在文本到图像生成领域表现出色,因其卓越的性能而在 AI 社区中迅速获得关注。在第三方评测(如 Artificial Analysis Image Arena)中,Halfmoon 在提示遵循、美学和排版等指标上排名第一,超越了 Recraft、Google、BFL 和 Midjourney 等知名模型。
Reve1.0冲上生图模型第一,主打照片集真实感
Reve 是一家致力于人工智能图像生成技术开发的公司,其最新推出的模型是 Reve Image 1.0,也被称为 Halfmoon。这个模型在文本到图像生成领域表现出色,因其卓越的性能而在 AI 社区中迅速获得关注。在第三方评测(如 Artificial Analysis Image Arena)中,Halfmoon 在提示遵循、美学和排版等指标上排名第一,超越了 Recraft、Google、BFL 和 Midjourney 等知名模型。

MCP 持续火爆,OpenAI 再度 open,拥抱 MCP
OpenAI 对其 Agents SDK 进行了重大更新,支持了对手 Anthropic 推出的 MCP 服务协议。正式成为AI界的“USB-C通用协议”。「MCP 已经成了一个蓬勃发展的开放标准,已经有几千个集成应用,而且还在增加。只有当 LLM 能够连接你现有的数据和日常使用的软件时,它们才能发挥最大的作用。」
MCP 持续火爆,OpenAI 再度 open,拥抱 MCP
OpenAI 对其 Agents SDK 进行了重大更新,支持了对手 Anthropic 推出的 MCP 服务协议。正式成为AI界的“USB-C通用协议”。「MCP 已经成了一个蓬勃发展的开放标准,已经有几千个集成应用,而且还在增加。只有当 LLM 能够连接你现有的数据和日常使用的软件时,它们才能发挥最大的作用。」

谷歌发布“迄今为止最智能的型号”Gemini 2.5 Pro”
Gemini 2.5 Pro 会在响应之前“思考”。新模型可以处理来自文本、音频、图像、视频和大型数据集的多模式输入,在常见基准测试中领先显著,Gemini 2.5 Pro 还可以理解编码项目的整个代码存储库。 总得来说 2.5 pro 的能力并没有 2.0 丰富,但是在常见领域能力更强大。想知道模型能力对比的话可以点击去查看,可以更清晰的了解有什么不同👉对比跳转链接
谷歌发布“迄今为止最智能的型号”Gemini 2.5 Pro”
Gemini 2.5 Pro 会在响应之前“思考”。新模型可以处理来自文本、音频、图像、视频和大型数据集的多模式输入,在常见基准测试中领先显著,Gemini 2.5 Pro 还可以理解编码项目的整个代码存储库。 总得来说 2.5 pro 的能力并没有 2.0 丰富,但是在常见领域能力更强大。想知道模型能力对比的话可以点击去查看,可以更清晰的了解有什么不同👉对比跳转链接

Google 推出 Gemini 实时 AI 视频功能
谷歌已开始向 Gemini Live 推出新的 AI 功能。能够“看到”你的屏幕或通过你的智能手机摄像头回答有关实时问题。这些功能是在谷歌首次展示为其提供支持的“Project Astra”工作近一年后推出的。产品使用方式和形态接近 Apple intelligence siri 的形态。
Google 推出 Gemini 实时 AI 视频功能
谷歌已开始向 Gemini Live 推出新的 AI 功能。能够“看到”你的屏幕或通过你的智能手机摄像头回答有关实时问题。这些功能是在谷歌首次展示为其提供支持的“Project Astra”工作近一年后推出的。产品使用方式和形态接近 Apple intelligence siri 的形态。

Google 决定终止开源 Android
Google 决定停止维护 Android 开源项目(AOSP),未来所有 Android 开发工作将仅在其内部闭源分支进行。此举旨在节约开支、增加收入,但可能对 Android 生态、开发者权益及市场竞争格局产生深远影响。主流手机厂商因与 Google 有协议,短期内影响不大,但长期看,非认证设备厂商及开发者或面临更多挑战,也再次为国产手机厂商敲响警钟。
Google 决定终止开源 Android
Google 决定停止维护 Android 开源项目(AOSP),未来所有 Android 开发工作将仅在其内部闭源分支进行。此举旨在节约开支、增加收入,但可能对 Android 生态、开发者权益及市场竞争格局产生深远影响。主流手机厂商因与 Google 有协议,短期内影响不大,但长期看,非认证设备厂商及开发者或面临更多挑战,也再次为国产手机厂商敲响警钟。

AI 产品榜发布最新统计数据,夸克成国内唯一月活破亿 AI 应用
说到国内 AI 产品排行榜第一的产品,大家的第一反应要么是豆包,要么是 Deepseek,唯独不会想到夸克,但是夸克却靠着实实在在的数据冲上榜首。3 月中旬,夸克上新功能夸克 AI 超级框,直接转型 AI 应用,靠着宣传和原有的基数直接坐上国内第一的宝座,所以如果微信也把自己分类到 AI 应用分类,是不是马上就能坐上国内第一的宝座了?🤔
微信 AI 搜索新增“快速思考”,采用混元 T1 模型
微信今年 2 月起灰度测试接入 Deepdeek。时隔一个多月,微信 AI 搜索除了“快速回答”和“深度思考”,又新增了一个“快速思考”选项,可由腾讯混元 T1 模型经过思考而提供回答。相信大家都开始翻冗长的深度思考等待过程了,若能享受深度思考输出的优秀结构化回答基础上能缩短思考等待时间,我双手双脚赞成。ps:微信深度思考有个设计细节“深度思考”过程可以折叠👍
微信聊天框内置元宝,超级App又一轮进化开始
AI技术正在从独立功能向基础设施转变。微信终于在聊天框放了个AI助手。「元宝红包封面助手」,可以提供陪聊、答题、作图以及定制红包封面等功能。实测会根据提问自动识别该走深度思考回答还是直接自己快速回复。通过将大模型产品以「AI版文件传输助手」形态嵌入高频聊天场景,微信将用户的工作流、信息流统一收束,通过总结公众号文章、解析文件、图片等刚需功能,微信在原有的功能之外,新增了一个可以持续产生价值的AI助手角色,这可能会让用户在微信的停留时长和打开频次迎来结构性增长。
三星电子正在开发智能眼镜,计划在今年年底上市。
据说三星在人体工学上投入了相当大的精力。此外,由于智能眼镜没有包含遥控器或按钮的设计,因此还在准备可以识别运动的摄像头和传感器。另一篇相关报道:三星即将推出具有显示和手势识别功能的智能眼镜
AI 产品榜发布最新统计数据,夸克成国内唯一月活破亿 AI 应用
说到国内 AI 产品排行榜第一的产品,大家的第一反应要么是豆包,要么是 Deepseek,唯独不会想到夸克,但是夸克却靠着实实在在的数据冲上榜首。3 月中旬,夸克上新功能夸克 AI 超级框,直接转型 AI 应用,靠着宣传和原有的基数直接坐上国内第一的宝座,所以如果微信也把自己分类到 AI 应用分类,是不是马上就能坐上国内第一的宝座了?🤔
微信 AI 搜索新增“快速思考”,采用混元 T1 模型
微信今年 2 月起灰度测试接入 Deepdeek。时隔一个多月,微信 AI 搜索除了“快速回答”和“深度思考”,又新增了一个“快速思考”选项,可由腾讯混元 T1 模型经过思考而提供回答。相信大家都开始翻冗长的深度思考等待过程了,若能享受深度思考输出的优秀结构化回答基础上能缩短思考等待时间,我双手双脚赞成。ps:微信深度思考有个设计细节“深度思考”过程可以折叠👍
微信聊天框内置元宝,超级App又一轮进化开始
AI技术正在从独立功能向基础设施转变。微信终于在聊天框放了个AI助手。「元宝红包封面助手」,可以提供陪聊、答题、作图以及定制红包封面等功能。实测会根据提问自动识别该走深度思考回答还是直接自己快速回复。通过将大模型产品以「AI版文件传输助手」形态嵌入高频聊天场景,微信将用户的工作流、信息流统一收束,通过总结公众号文章、解析文件、图片等刚需功能,微信在原有的功能之外,新增了一个可以持续产生价值的AI助手角色,这可能会让用户在微信的停留时长和打开频次迎来结构性增长。
三星电子正在开发智能眼镜,计划在今年年底上市。
据说三星在人体工学上投入了相当大的精力。此外,由于智能眼镜没有包含遥控器或按钮的设计,因此还在准备可以识别运动的摄像头和传感器。另一篇相关报道:三星即将推出具有显示和手势识别功能的智能眼镜

📒 本周值得读的文章
用户界面之外:触感体验
少有的将触感体验讲清楚讲透的文章。呼应了【第 006 期】中【我们已对界面失去了感知】那篇文章,数字化生活让我们离现实世界越来越远,而触感能回归物理属性,增强对现实世界的感知。人类能感知的触感反馈多样,智能设备主要给予振动反馈,可模拟真实物理体验,增强用户与数字界面互动。
生成式 AI 体验中的新兴用户体验模式
本文深度解析生成式 AI 用户体验的演进逻辑,从命令行到图形界面,再到上下文捆绑与用户策展的智能交互革新,揭示如何通过简化流程与信任设计降低使用门槛。文章提出“AI 协作画布”的生态构想,预示人机共生的未来工作场景,为设计师与开发者提供重构人机协作范式的关键洞察。
用户界面之外:触感体验
少有的将触感体验讲清楚讲透的文章。呼应了【第 006 期】中【我们已对界面失去了感知】那篇文章,数字化生活让我们离现实世界越来越远,而触感能回归物理属性,增强对现实世界的感知。人类能感知的触感反馈多样,智能设备主要给予振动反馈,可模拟真实物理体验,增强用户与数字界面互动。
生成式 AI 体验中的新兴用户体验模式
本文深度解析生成式 AI 用户体验的演进逻辑,从命令行到图形界面,再到上下文捆绑与用户策展的智能交互革新,揭示如何通过简化流程与信任设计降低使用门槛。文章提出“AI 协作画布”的生态构想,预示人机共生的未来工作场景,为设计师与开发者提供重构人机协作范式的关键洞察。
🌟 本周值得关注的专利
谷歌智能眼镜新专利:实时监测用户头部姿势
2025 年 3 月 26 日,谷歌获得一项智能眼镜专利,涉及检测框架位移的系统和方法。该技术通过姿态检测系统和电容传感器,实时监测用户头部姿势,调整视线追踪算法,以保持眼动追踪准确性。
THX 之父新专利:苹果要让电影懂得“等观众笑完”
苹果公司获批名为《观众反应媒体》的新专利。该系统通过麦克风或摄像头检测用户笑声后,自动延长当前播放的影片场景(画面与声音同步减缓),确保观众不错过任何台词。该系统通过设备麦克风、摄像 头或头戴设备的骨传导传感器捕捉用户笑声,并通过机器学习算法区分笑声与环境噪音。该系统检测到笑声后,自动延长当前片段播放时长(类似剧场停顿),并在笑声期间动态添加混响效果,模拟“活跃房间”声学环境,并通过多声道系统(如环绕声)可定向增强混响层次。
谷歌智能眼镜新专利:实时监测用户头部姿势
2025 年 3 月 26 日,谷歌获得一项智能眼镜专利,涉及检测框架位移的系统和方法。该技术通过姿态检测系统和电容传感器,实时监测用户头部姿势,调整视线追踪算法,以保持眼动追踪准确性。
THX 之父新专利:苹果要让电影懂得“等观众笑完”
苹果公司获批名为《观众反应媒体》的新专利。该系统通过麦克风或摄像头检测用户笑声后,自动延长当前播放的影片场景(画面与声音同步减缓),确保观众不错过任何台词。该系统通过设备麦克风、摄像 头或头戴设备的骨传导传感器捕捉用户笑声,并通过机器学习算法区分笑声与环境噪音。该系统检测到笑声后,自动延长当前片段播放时长(类似剧场停顿),并在笑声期间动态添加混响效果,模拟“活跃房间”声学环境,并通过多声道系统(如环绕声)可定向增强混响层次。
🍚 本周的下饭信息
Sam Altman 说 GPT-5 将免费开放,DeepSeek 教训了我们,DeepSeek 的火爆是因为免费不是因为模型能力? 万字访谈实录
谷歌“圈搜”更新透明导航栏,还以为是谷歌要优化导航条沉浸的问题,结果发现只是圈即搜做了导航条适配
Apple Intelligent 中文版、优先级通知即将登录,苹果向 iPhone 和 iPad 用户推送了 iOS / iPadOS 18.4 RC 更新中 Apple 智能(Apple Intelligence)新增简体中文。这意味着,国行版的苹果 AI 又能再进一步
亚马逊推出个性化购物提示,可通过自然语言搜索相关商品并推荐优惠活动,推动 AI 在购物领域的应用
国产 AI 智能体 Manus 启动全球用户见面会,加速封闭测试很多应用都在推出使用于自家产品定位的 AI 智能体,除了携程旅行、小红书,现在知乎直答推出全新版本:降低 A I 幻觉 回答可直接溯源答主
WWDC 2025 时间已定:6 月 9 日。届时将带来 iOS 19、MacOS 16、WatchOS 12、VisionOS 3 和 TvOS 19
百度对话式应用开发平台「秒哒」上线!允许用户通过自然语言直接描述需求,系统即可自动生成具备完整功能的应用代码
苹果折叠 iPhone 概念图曝光,灵动岛不居中?
Sam Altman 说 GPT-5 将免费开放,DeepSeek 教训了我们,DeepSeek 的火爆是因为免费不是因为模型能力? 万字访谈实录
谷歌“圈搜”更新透明导航栏,还以为是谷歌要优化导航条沉浸的问题,结果发现只是圈即搜做了导航条适配
Apple Intelligent 中文版、优先级通知即将登录,苹果向 iPhone 和 iPad 用户推送了 iOS / iPadOS 18.4 RC 更新中 Apple 智能(Apple Intelligence)新增简体中文。这意味着,国行版的苹果 AI 又能再进一步
亚马逊推出个性化购物提示,可通过自然语言搜索相关商品并推荐优惠活动,推动 AI 在购物领域的应用
国产 AI 智能体 Manus 启动全球用户见面会,加速封闭测试很多应用都在推出使用于自家产品定位的 AI 智能体,除了携程旅行、小红书,现在知乎直答推出全新版本:降低 A I 幻觉 回答可直接溯源答主
WWDC 2025 时间已定:6 月 9 日。届时将带来 iOS 19、MacOS 16、WatchOS 12、VisionOS 3 和 TvOS 19
百度对话式应用开发平台「秒哒」上线!允许用户通过自然语言直接描述需求,系统即可自动生成具备完整功能的应用代码
苹果折叠 iPhone 概念图曝光,灵动岛不居中?
继续阅读



