AI新闻 | 第2页 | goodux 好体验

标签筛选

已选标签:

1月 15日

8 条新闻

23:06

OpenAI 测试仅用电话号码注册 ChatGPT

OpenAI 正在测试仅通过手机号注册 ChatGPT 的功能，目前在美国和印度进行 Beta 测试。此举旨在降低用户使用门槛，推动产品普及。然而，该功能暂不支持付费计划升级和多因素认证，且存在号码重复使用问题。OpenAI 还通过电话聊天和 WhatsApp 集成等低门槛方式扩展用户触达。尽管 ChatGPT 拥有 3 亿周活跃用户，OpenAI 仍面临巨额亏损，主要源于 AI 训练基础设施等高成本投入。公司正考虑调整订阅价格并探索按使用量计费模式，以优化商业模型。

来源：TechCrunch AI

22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司，旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库，专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长，Rockfish 通过技术差异化（如持续数据摄入）和高质量团队（多位数据科学博士）脱颖而出。该公司已获 600 万美元融资，客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长，合成数据领域竞争加剧，Tonic AI、Mostly AI 等公司也在积极布局。

来源：TechCrunch AI

22:00

微软最新的企业Copilot计划采用按需付费模式

微软推出基于 GPT-4o 的 Copilot Chat 按需付费计划，为企业用户提供 AI 驱动的生产力工具，包括业务流程自动化、文档生成和图像创建等功能。该计划旨在通过灵活的定价模式吸引更多企业尝试 AI 应用，同时推动组织内 AI 使用习惯的建立。尽管 Copilot Chat 功能较 Microsoft 365 Copilot 精简，但其自动化代理功能（如销售会议准备和现场服务指令分发）展示了 AI 在任务自动化领域的潜力。微软 CEO 纳德拉强调，2025 年将聚焦于“模型优先应用”，推动 AI 技术在各领域的重塑。

来源：TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI，该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI，推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术，快速生成“SimReady”数字孪生，将 CAD 文件转化为功能化 3D 环境，加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域，通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局，创建适用于机器人等高级自动化系统的数字孪生，弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展，为工业 AI 应用提供更高效的解决方案。

来源：TechCrunch AI

05:47

任天堂Switch 2或于本周公布：截至目前的传闻与事实

任天堂Switch 2或于本周公布：截至目前的传闻与事实

Nintendo Switch 2 即将发布，预计将延续前代产品的成功，并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布，但业界猜测新主机可能在图形处理、多模态交互（如磁吸 Joy-Con）和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外，向后兼容性确保了现有用户的平滑过渡，进一步巩固 Nintendo 在游戏市场的地位。

来源：TechCrunch AI

04:38

谷歌的NotebookLM不得不训练其AI播客主持人不要对人类表现出不耐烦

Google NotebookLM 推出 AI 生成播客功能，用户可实时“打断”AI 主持人提问。初期 AI 表现出类似人类的不耐烦反应，如“我正要说到这个”。团队通过调整提示词设计，优化了 AI 的友好度和互动性。该案例揭示了 AI 在自然语言交互中的挑战，特别是在情感表达和上下文理解方面。未来，类似技术在多模态对话系统中的应用将推动更自然的 AI 交互体验。

来源：TechCrunch AI

02:00

ChatGPT 现在允许您安排提醒和重复任务

ChatGPT 现在允许您安排提醒和重复任务

OpenAI 推出 ChatGPT 任务管理功能，支持设置提醒和周期性请求，标志着其向 AI 代理（AI agents）方向迈出重要一步。该功能允许用户通过自然语言指令创建任务，如定期获取天气预报或新闻简报，并支持跨平台推送通知。尽管当前功能有限，但展示了大型语言模型在智能助手领域的潜力，为未来更复杂的代理系统（如代码编写、旅行预订）奠定基础。OpenAI 计划通过测试期优化功能，并逐步扩展至移动端和免费版 ChatGPT。这一进展预示着 AI 代理将在 2025 年进入更广泛的应用场景。

来源：TechCrunch AI

01:49

24岁创业者退出首家公司加入Coinbase，为其新项目筹集300万美元

Pryce Yebesi 新创公司 Open Ledger 推出 AI 驱动的模块化会计工具，嵌入企业现有产品中，提供自动化分类、对账和财务报告功能。通过优化数据层，结合 LLM 技术，Open Ledger 解决了传统会计软件的效率和安全问题，目标为中小型企业提供高效、安全的财务管理解决方案。公司已获 300 万美元融资，计划扩展团队并支持百万级用户。

来源：TechCrunch AI

1月 13日

3 条新闻

09:47

Adobe FaceLift：单张照片生成高保真 3D 头部模型

Adobe FaceLift：单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术，仅需一张人脸照片，就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图，然后通过 GS-LRM 重建器生成 3D 高斯样条表示，实现全头新视角的合成。

此外，FaceLift 还能处理视频输入，进行 4D 合成，并与 2D 动画技术结合，实现 3D 面部动画。

从官网的一些交互式案例来看，效果还不错，不过不能放大看，恐怖谷效应拉满了。目前这项技术还没有开源，关注我为你持续跟进。

来源：三花快讯

09:47

阿里通义团队推出 Qwen Chat：支持全系列 Qwen 模型

阿里通义团队推出 Qwen Chat：支持全系列 Qwen 模型

Qwen Chat 是阿里通义团队近日上线的一款基于开源的 Open WebUI 的 WebUI，支持 Qwen 全系列模型。

模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型，以及 Qwen2.5-Coder-32B-Instruct 编程模型。

Qwen Chat 支持同时对比多个模型，还即将推出网络搜索、图像生成和语音模式，值得期待。

来源：三花快讯

09:47

xAI 发布 Grok iOS 应用，支持图像生成与实时数据访问

xAI 发布 Grok iOS 应用，支持图像生成与实时数据访问

Grok iOS App 现已上线美区 App Store，支持生成图像和对话。用户需要使用 X 账号登录，以实时访问 X 和 Web 数据。

系统版本要求较高，需更新至 iOS 17 才能安装，如果你在用巨魔啥的就无缘了。安卓版本即将推出。

来源：三花快讯

1月 11日

1 条新闻

23:00

英伟达的AI帝国：聚焦其顶级初创投资

Nvidia 在生成式 AI 浪潮中迅速崛起，成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来，其营收和股价大幅增长，并显著加大了对 AI 初创企业的投资。2024 年，Nvidia 参与了 49 轮 AI 公司融资，远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业，以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统，推动大模型、自动驾驶、AI 基础设施等技术的商业化落地，展现了其在 AI 产业链中的核心地位。

来源：TechCrunch AI

1月 10日

6 条新闻

09:54

Dify v1.0.0-beta 发布：全新 Marketplace 和插件系统上线

Dify v1.0.0-beta 发布：全新 Marketplace 和插件系统上线

Dify Marketplace 发布了 v1.0.0-beta 版本，带来了全新的插件系统。现在，模型和工具等都成为了插件系统的一部分，用户可以更方便地扩展和定制功能。好久没关注 Dify 了，终于快要正式版了！

来源：三花快讯

09:54

百度与复旦大学联合开源 Hello3：革命性数字人头动画技术

Hello3 是复旦大学和百度联合开源的数字人头（肖像动画）技术，能让静态肖像在各种场景下动起来，而且动作自然、画面逼真。它不仅能处理正面肖像，还能应对各种角度和姿态，甚至能让肖像与周围物体互动。

与之前的 Hallo2 相比，Hallo3 在生成动态场景和沉浸式背景方面有了显著提升，让肖像动画不再局限于简单的表情变化，而是能将角色也融入到场景中。

来源：三花快讯

08:31

英伟达的AI头像出现在我的电脑屏幕上，让我感到十分诡异

英伟达的AI头像出现在我的电脑屏幕上，让我感到十分诡异

Nvidia 在 CES 2025 上推出桌面 AI 助手 R2X，结合生成式游戏技术与大语言模型（如 GPT-4o 和 Grok），提供多模态交互能力。R2X 支持文本、语音输入，可处理文件、实时屏幕分析，并集成检索增强生成（RAG）技术。尽管原型存在视觉和功能缺陷（如屏幕识别错误），Nvidia 计划 2025 年上半年开源该技术，推动开发者生态。R2X 展示了 AI 助手在桌面应用中的潜力，但也凸显了多模态模型在实时交互和准确性上的技术挑战。

来源：TechCrunch AI

05:52

ChatGPT 的最新功能允许用户为其赋予“健谈”和“Z 世代”等特质

ChatGPT 的最新功能允许用户为其赋予“健谈”和“Z 世代”等特质

OpenAI 推出 ChatGPT 个性化交互新功能，允许用户通过定制指令菜单设置偏好名称、职业及期望的聊天机器人特质（如“健谈”、“鼓励性”等）。该功能基于提示工程（prompt engineering）技术，优化用户与 AI 的交互体验，提升个性化响应质量。尽管界面更新更友好，技术核心仍依赖现有提示工程框架。OpenAI 强调对定制指令的内容审核，确保符合使用条款。此举旨在增强 ChatGPT 的用户粘性，进一步推动 AI 助手在个性化服务领域的应用。

来源：TechCrunch AI

01:30

2025年国际消费电子展：本届展会最奇特的技术产品和主张

CES 2025 展示了多项 AI 驱动的创新产品，涵盖智能家居、食品科技和可穿戴设备等领域。Yukai Engineering 推出 Nékojita FuFu 机器人猫，通过 AI 控制气流冷却食物；Kirin Holdings 的电子勺利用弱电流增强食物咸味；Spicerr 的 AI 香料分配器根据食谱智能调配香料；Birdfy 的智能鸟浴通过 AI 检测鸟类并拍照识别。此外，基于 GPT 的 Omi 可穿戴设备提供实时对话总结和任务管理功能。这些产品凸显了 AI 在日常生活场景中的多样化应用和持续创新趋势。

来源：TechCrunch AI

00:03

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

Google 正在测试基于 AI 的“Daily Listen”功能，通过用户 Discover 订阅内容自动生成个性化播客。该功能利用大语言模型和多模态技术，将用户兴趣转化为 5 分钟音频摘要，并附带相关故事链接。Daily Listen 与 NotebookLM 的 Audio Overviews 类似，均通过 AI 虚拟主持人生成内容，展现了 AI 在个性化内容生成领域的创新应用。该功能目前面向美国用户开放，标志着 AI 在音频内容创作和个性化推荐领域的进一步落地。

来源：TechCrunch AI

1月 9日

2 条新闻

21:27

Rounded是一个AI编排平台，让任何人都能构建AI语音代理

法国初创公司 Rounded 开发了一个 AI 语音代理编排平台，允许企业构建定制化语音代理。其核心是通过整合语音转文本、大语言模型（如 GPT-4）和文本转语音技术，优化特定场景的语音交互体验。Rounded 已在医疗领域推出 AI 语音代理 Donna，用于麻醉师预约管理，显著提升了通话效率和响应速度（延迟降至 600 毫秒）。该平台支持企业选择不同 AI 模型，并通过提示工程优化代理性能，展现了 AI 语音技术在垂直领域的商业化潜力。

来源：TechCrunch AI

15:25

xAI 正在测试其Grok聊天机器人的独立iOS应用

Elon Musk 的 AI 公司 xAI 推出独立 iOS 应用 Grok，扩展其多模态生成式 AI 能力。Grok 支持实时数据访问、文本重写、段落摘要、问答及文本生成图像等功能，尤其在图像生成领域表现出色，支持逼真渲染且限制较少。xAI 计划通过 Grok.com 提供网页版访问，进一步推动 AI 助手在智能交互与内容创作领域的应用。此举标志着生成式 AI 在跨平台部署与商业化落地上的重要进展。

来源：TechCrunch AI