
类型:七日精选
图片来源:网络
图片来源:网络

ODD 编辑组
从世界发现故事、思考和专业知识。
2025年5月29日
#015 对话为界:模型即平台与多形态交互的合流
#015 对话为界:模型即平台与多形态交互的合流
聚焦“模型即平台”艾维携OpenAI推硬件,谷歌多模态;iOS19日历重构;探讨“小V”多形态交互。
聚焦“模型即平台”艾维携OpenAI推硬件,谷歌多模态;iOS19日历重构;探讨“小V”多形态交互。
📰 本周值得关注的资讯
前苹果首席设计师在 OpenAI 预研产品概念流出
前情提要,乔纳森·艾维上周三以 64 亿美元的价格将其新成立的硬件公司 io 与 OpenAI 合并。艾维将为 OpenAI 提供硬件产品设计方面的建议,负责设计一系列全新的 AI 硬件产品。另外,他的一些前苹果员工也将加入这家人工智能公司。
前苹果首席设计师在 OpenAI 预研产品概念流出
前情提要,乔纳森·艾维上周三以 64 亿美元的价格将其新成立的硬件公司 io 与 OpenAI 合并。艾维将为 OpenAI 提供硬件产品设计方面的建议,负责设计一系列全新的 AI 硬件产品。另外,他的一些前苹果员工也将加入这家人工智能公司。

招聘信息确认苹果 iOS 19 将重构日历应用
MacGeneration 几周前披露,苹果于 2024 年收购了 Mayday Labs。这家公司曾开发一款名为 Mayday 的 AI 日历应用,旨在“帮助用户组织、保护和管理日常事务”,不过该应用已于去年 5 月关闭。
而苹果于 2025 年 4 月 29 日发布的一则招聘启事,寻找“日历体验高级软件工程师”,明确提到要“重新构想苹果平台上的现代日历”。
招聘信息确认苹果 iOS 19 将重构日历应用
MacGeneration 几周前披露,苹果于 2024 年收购了 Mayday Labs。这家公司曾开发一款名为 Mayday 的 AI 日历应用,旨在“帮助用户组织、保护和管理日常事务”,不过该应用已于去年 5 月关闭。
而苹果于 2025 年 4 月 29 日发布的一则招聘启事,寻找“日历体验高级软件工程师”,明确提到要“重新构想苹果平台上的现代日历”。

一文读懂 Google I/O 2025 开发者大会:开启 “模型即平台” 的 AI 生态新时代
谷歌 I/O 2025 发布了 Gemini 2.5 Pro 和 Flash 模型,强调 AI 智能体(Agent)将深度整合到搜索、Chrome、Gemini App 等核心产品。Gemini 2.5 Pro 成为谷歌最强通用 AI,支持多模态输入、实时语音、跨平台部署。AI Studio、Stitch、Casey 等新工具降低开发门槛,助力开发者创新。Google Beam 推出 3D 视频通信,Imagine 4 和 Veo 3 提升图像、视频生成能力。Gemini Live 语音助手升级,支持 45 种语言和多任务处理。谷歌还发布了 XR 智能眼镜、AI Ultra 订阅套餐,推动 AI 生态迈向“模型即平台”新时代。
一文读懂 Google I/O 2025 开发者大会:开启 “模型即平台” 的 AI 生态新时代
谷歌 I/O 2025 发布了 Gemini 2.5 Pro 和 Flash 模型,强调 AI 智能体(Agent)将深度整合到搜索、Chrome、Gemini App 等核心产品。Gemini 2.5 Pro 成为谷歌最强通用 AI,支持多模态输入、实时语音、跨平台部署。AI Studio、Stitch、Casey 等新工具降低开发门槛,助力开发者创新。Google Beam 推出 3D 视频通信,Imagine 4 和 Veo 3 提升图像、视频生成能力。Gemini Live 语音助手升级,支持 45 种语言和多任务处理。谷歌还发布了 XR 智能眼镜、AI Ultra 订阅套餐,推动 AI 生态迈向“模型即平台”新时代。

谷歌移动端专用 AI,多模态 Gemma 3n 模型
谷歌推出 Gemma 3n,专为移动设备 AI 构建的多模式模型。 它运行时占用的内存更小,将 RAM 使用量减少了近 3 倍,从而可以直接在手机上运行更复杂的应用程序,或从云端进行直播。
谷歌移动端专用 AI,多模态 Gemma 3n 模型
谷歌推出 Gemma 3n,专为移动设备 AI 构建的多模式模型。 它运行时占用的内存更小,将 RAM 使用量减少了近 3 倍,从而可以直接在手机上运行更复杂的应用程序,或从云端进行直播。

飞书知识问答,给企业如何用好 AI 打了个小样
飞书上新了“飞书知识问答”,这是一个基于企业知识的企业专属 AI 问答工具。它能根据用户在飞书上有权限访问的所有聊天消息、协同文档、多维表格、知识库以及各种格式文件等数据,直接给出答案。用户还能借助这个工具,基于企业知识进行内容创作。使用 DeepSeek、豆包、Kimi 等消费级的通用 AI 工具进行提问,得到的回答是基于大模型基础知识以及实时更新的互联网知识,而在飞书端内使用知识问答,当用户选择“使用知识”而不是“联网搜索”,AI 会根据企业内部信息而不是公域互联网信息生成答案。
飞书知识问答,给企业如何用好 AI 打了个小样
飞书上新了“飞书知识问答”,这是一个基于企业知识的企业专属 AI 问答工具。它能根据用户在飞书上有权限访问的所有聊天消息、协同文档、多维表格、知识库以及各种格式文件等数据,直接给出答案。用户还能借助这个工具,基于企业知识进行内容创作。使用 DeepSeek、豆包、Kimi 等消费级的通用 AI 工具进行提问,得到的回答是基于大模型基础知识以及实时更新的互联网知识,而在飞书端内使用知识问答,当用户选择“使用知识”而不是“联网搜索”,AI 会根据企业内部信息而不是公域互联网信息生成答案。

豆包上线实时视频对话功能
支持通过摄像头识别外界信息进行对话,整体比较丝滑流畅。除此之外还支持共享手机或者电脑的屏幕给豆包,操作应用的同时,随时向豆包进行提问。
体验还是比较丝滑的,电脑端和移动端都已上线。
豆包上线实时视频对话功能
支持通过摄像头识别外界信息进行对话,整体比较丝滑流畅。除此之外还支持共享手机或者电脑的屏幕给豆包,操作应用的同时,随时向豆包进行提问。
体验还是比较丝滑的,电脑端和移动端都已上线。

Syft AI-新闻定制聚合工具
产品描述:
Syft AI 是一款基于兴趣定制的新闻聚合工具,主打用户感兴趣的话题的每日推送,适合那些需要每日浏览特定话题新闻的用户。除了官方创建的话题外,用户还可以创建自己感兴趣的话题。只需一句话,即可获得全球可信来源的个性化资讯推荐。
产品亮点:
一句话定制新闻频道。用户只需用一句自然语言输入感兴趣的主题,系统可自动生成对应的新闻频道。
母语日报总结 + 多语种支持。系统每天以用户的母语自动总结重点新闻,同时支持多语种内容消费,覆盖全球热点。
推送时间你说了算。用户可自定义新闻推送的时间,系统将会根据你的节奏定时送达新闻。
信源 100%真实,正在加入自定义源。新闻内容来自全球顶级媒体和权威机构,确保信息真实、无虚假标题党。
Syft AI-新闻定制聚合工具
产品描述:
Syft AI 是一款基于兴趣定制的新闻聚合工具,主打用户感兴趣的话题的每日推送,适合那些需要每日浏览特定话题新闻的用户。除了官方创建的话题外,用户还可以创建自己感兴趣的话题。只需一句话,即可获得全球可信来源的个性化资讯推荐。
产品亮点:
一句话定制新闻频道。用户只需用一句自然语言输入感兴趣的主题,系统可自动生成对应的新闻频道。
母语日报总结 + 多语种支持。系统每天以用户的母语自动总结重点新闻,同时支持多语种内容消费,覆盖全球热点。
推送时间你说了算。用户可自定义新闻推送的时间,系统将会根据你的节奏定时送达新闻。
信源 100%真实,正在加入自定义源。新闻内容来自全球顶级媒体和权威机构,确保信息真实、无虚假标题党。

📒 本周值得读的文章
我们用什么语言思考? - 少数派
本文探讨了“思维语”理论,认为人类思维并非依赖自然语言,而是基于一种更深层的认知结构。自然语言主要为交流设计,包含模糊和噪音,无法完全承载复杂思维。文章结合语言学、哲学观点及大模型研究,指出思维活动往往先于语言,模型的多语言处理也间接印证了“思维语”的存在。最终,作者认为大模型为理解人类思维提供了新窗口,未来或可借助其反向理解语言与认知本质。
我们用什么语言思考? - 少数派
本文探讨了“思维语”理论,认为人类思维并非依赖自然语言,而是基于一种更深层的认知结构。自然语言主要为交流设计,包含模糊和噪音,无法完全承载复杂思维。文章结合语言学、哲学观点及大模型研究,指出思维活动往往先于语言,模型的多语言处理也间接印证了“思维语”的存在。最终,作者认为大模型为理解人类思维提供了新窗口,未来或可借助其反向理解语言与认知本质。
🌟 本周值得关注的专利
三星已提交欧洲专利,揭示未来可能比指纹识别更安全的掌纹识别系统
该专利提出利用智能手机摄像头扫描手掌,从掌纹图像中提取至少三个特征坐标,结合手掌的旋转角度,动态调整识别区域,从而实现更精准和安全的身份认证。相比指纹,掌纹覆盖面积更大,可提取的信息更多,包括掌纹纹路、血管形状等,适用于金融、医疗、物联网等多种场景,提升了生物识别的安全性和应用广度。
苹果这项专利可以分析每只手的手势,以确定每只手是否处于外设使用模式
这项专利主要聚焦于未来苹果设备(如 Mac 台式机、MacBook、iDevices 及 Vision 相关设备)对手势识别的智能化。其核心创新点在于:
手势与外设使用模式区分:系统能分析每只手的动作,判断其是在进行手势操作还是在使用外设(如键盘、鼠标等)。如果检测到手正在使用外设,则忽略该手的手势输入,防止误操作。
动态切换模式:当手部未处于外设使用状态时,系统允许并处理手势输入,实现自然的人机交互。
手势输入的取消机制:如果用户刚做出手势后又立即触发了外设事件(如敲击键盘),系统会取消刚才的手势操作,避免冲突。
注视追踪辅助判断:系统还可结合用户的注视方向、眼球位置等信息,进一步判断用户的意图,提高识别准确率。
应用场景:例如,一只手在空中做手势控制界面,另一只手在键盘上打字,系统能智能区分并分别处理。
三星已提交欧洲专利,揭示未来可能比指纹识别更安全的掌纹识别系统
该专利提出利用智能手机摄像头扫描手掌,从掌纹图像中提取至少三个特征坐标,结合手掌的旋转角度,动态调整识别区域,从而实现更精准和安全的身份认证。相比指纹,掌纹覆盖面积更大,可提取的信息更多,包括掌纹纹路、血管形状等,适用于金融、医疗、物联网等多种场景,提升了生物识别的安全性和应用广度。
苹果这项专利可以分析每只手的手势,以确定每只手是否处于外设使用模式
这项专利主要聚焦于未来苹果设备(如 Mac 台式机、MacBook、iDevices 及 Vision 相关设备)对手势识别的智能化。其核心创新点在于:
手势与外设使用模式区分:系统能分析每只手的动作,判断其是在进行手势操作还是在使用外设(如键盘、鼠标等)。如果检测到手正在使用外设,则忽略该手的手势输入,防止误操作。
动态切换模式:当手部未处于外设使用状态时,系统允许并处理手势输入,实现自然的人机交互。
手势输入的取消机制:如果用户刚做出手势后又立即触发了外设事件(如敲击键盘),系统会取消刚才的手势操作,避免冲突。
注视追踪辅助判断:系统还可结合用户的注视方向、眼球位置等信息,进一步判断用户的意图,提高识别准确率。
应用场景:例如,一只手在空中做手势控制界面,另一只手在键盘上打字,系统能智能区分并分别处理。
🍚 本周的下饭信息
继续阅读



