已选标签:
1月 15日
8 条新闻
23:06

OpenAI 测试仅用电话号码注册 ChatGPT

OpenAI 正在测试仅通过手机号注册 ChatGPT 的功能,目前在美国和印度进行 Beta 测试。此举旨在降低用户使用门槛,推动产品普及。然而,该功能暂不支持付费计划升级和多因素认证,且存在号码重复使用问题。OpenAI 还通过电话聊天和 WhatsApp 集成等低门槛方式扩展用户触达。尽管 ChatGPT 拥有 3 亿周活跃用户,OpenAI 仍面临巨额亏损,主要源于 AI 训练基础设施等高成本投入。公司正考虑调整订阅价格并探索按使用量计费模式,以优化商业模型。

来源:TechCrunch AI

22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。

来源:TechCrunch AI

22:00

微软最新的企业Copilot计划采用按需付费模式

微软推出基于 GPT-4o 的 Copilot Chat 按需付费计划,为企业用户提供 AI 驱动的生产力工具,包括业务流程自动化、文档生成和图像创建等功能。该计划旨在通过灵活的定价模式吸引更多企业尝试 AI 应用,同时推动组织内 AI 使用习惯的建立。尽管 Copilot Chat 功能较 Microsoft 365 Copilot 精简,但其自动化代理功能(如销售会议准备和现场服务指令分发)展示了 AI 在任务自动化领域的潜力。微软 CEO 纳德拉强调,2025 年将聚焦于“模型优先应用”,推动 AI 技术在各领域的重塑。

来源:TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。

来源:TechCrunch AI

05:47

任天堂Switch 2或于本周公布:截至目前的传闻与事实

任天堂Switch 2或于本周公布:截至目前的传闻与事实

Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。

来源:TechCrunch AI

04:38

谷歌的NotebookLM不得不训练其AI播客主持人不要对人类表现出不耐烦

Google NotebookLM 推出 AI 生成播客功能,用户可实时“打断”AI 主持人提问。初期 AI 表现出类似人类的不耐烦反应,如“我正要说到这个”。团队通过调整提示词设计,优化了 AI 的友好度和互动性。该案例揭示了 AI 在自然语言交互中的挑战,特别是在情感表达和上下文理解方面。未来,类似技术在多模态对话系统中的应用将推动更自然的 AI 交互体验。

来源:TechCrunch AI

02:00

ChatGPT 现在允许您安排提醒和重复任务

ChatGPT 现在允许您安排提醒和重复任务

OpenAI 推出 ChatGPT 任务管理功能,支持设置提醒和周期性请求,标志着其向 AI 代理(AI agents)方向迈出重要一步。该功能允许用户通过自然语言指令创建任务,如定期获取天气预报或新闻简报,并支持跨平台推送通知。尽管当前功能有限,但展示了大型语言模型在智能助手领域的潜力,为未来更复杂的代理系统(如代码编写、旅行预订)奠定基础。OpenAI 计划通过测试期优化功能,并逐步扩展至移动端和免费版 ChatGPT。这一进展预示着 AI 代理将在 2025 年进入更广泛的应用场景。

来源:TechCrunch AI

01:49

24岁创业者退出首家公司加入Coinbase,为其新项目筹集300万美元

Pryce Yebesi 新创公司 Open Ledger 推出 AI 驱动的模块化会计工具,嵌入企业现有产品中,提供自动化分类、对账和财务报告功能。通过优化数据层,结合 LLM 技术,Open Ledger 解决了传统会计软件的效率和安全问题,目标为中小型企业提供高效、安全的财务管理解决方案。公司已获 300 万美元融资,计划扩展团队并支持百万级用户。

来源:TechCrunch AI

1月 13日
3 条新闻
09:47

Adobe FaceLift:单张照片生成高保真 3D 头部模型

Adobe FaceLift:单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。

此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。

从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。

来源:三花快讯

1月 11日
1 条新闻
23:00

英伟达的AI帝国:聚焦其顶级初创投资

Nvidia 在生成式 AI 浪潮中迅速崛起,成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来,其营收和股价大幅增长,并显著加大了对 AI 初创企业的投资。2024 年,Nvidia 参与了 49 轮 AI 公司融资,远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业,以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统,推动大模型、自动驾驶、AI 基础设施等技术的商业化落地,展现了其在 AI 产业链中的核心地位。

来源:TechCrunch AI

1月 10日
6 条新闻
09:54

百度与复旦大学联合开源 Hello3:革命性数字人头动画技术

Hello3 是复旦大学和百度联合开源的数字人头(肖像动画)技术,能让静态肖像在各种场景下动起来,而且动作自然、画面逼真。它不仅能处理正面肖像,还能应对各种角度和姿态,甚至能让肖像与周围物体互动。

与之前的 Hallo2 相比,Hallo3 在生成动态场景和沉浸式背景方面有了显著提升,让肖像动画不再局限于简单的表情变化,而是能将角色也融入到场景中。

来源:三花快讯

08:31

英伟达的AI头像出现在我的电脑屏幕上,让我感到十分诡异

英伟达的AI头像出现在我的电脑屏幕上,让我感到十分诡异

Nvidia 在 CES 2025 上推出桌面 AI 助手 R2X,结合生成式游戏技术与大语言模型(如 GPT-4o 和 Grok),提供多模态交互能力。R2X 支持文本、语音输入,可处理文件、实时屏幕分析,并集成检索增强生成(RAG)技术。尽管原型存在视觉和功能缺陷(如屏幕识别错误),Nvidia 计划 2025 年上半年开源该技术,推动开发者生态。R2X 展示了 AI 助手在桌面应用中的潜力,但也凸显了多模态模型在实时交互和准确性上的技术挑战。

来源:TechCrunch AI

05:52

ChatGPT 的最新功能允许用户为其赋予“健谈”和“Z 世代”等特质

ChatGPT 的最新功能允许用户为其赋予“健谈”和“Z 世代”等特质

OpenAI 推出 ChatGPT 个性化交互新功能,允许用户通过定制指令菜单设置偏好名称、职业及期望的聊天机器人特质(如“健谈”、“鼓励性”等)。该功能基于提示工程(prompt engineering)技术,优化用户与 AI 的交互体验,提升个性化响应质量。尽管界面更新更友好,技术核心仍依赖现有提示工程框架。OpenAI 强调对定制指令的内容审核,确保符合使用条款。此举旨在增强 ChatGPT 的用户粘性,进一步推动 AI 助手在个性化服务领域的应用。

来源:TechCrunch AI

01:30

2025年国际消费电子展:本届展会最奇特的技术产品和主张

CES 2025 展示了多项 AI 驱动的创新产品,涵盖智能家居、食品科技和可穿戴设备等领域。Yukai Engineering 推出 Nékojita FuFu 机器人猫,通过 AI 控制气流冷却食物;Kirin Holdings 的电子勺利用弱电流增强食物咸味;Spicerr 的 AI 香料分配器根据食谱智能调配香料;Birdfy 的智能鸟浴通过 AI 检测鸟类并拍照识别。此外,基于 GPT 的 Omi 可穿戴设备提供实时对话总结和任务管理功能。这些产品凸显了 AI 在日常生活场景中的多样化应用和持续创新趋势。

来源:TechCrunch AI

00:03

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

Google 正在测试基于 AI 的“Daily Listen”功能,通过用户 Discover 订阅内容自动生成个性化播客。该功能利用大语言模型和多模态技术,将用户兴趣转化为 5 分钟音频摘要,并附带相关故事链接。Daily Listen 与 NotebookLM 的 Audio Overviews 类似,均通过 AI 虚拟主持人生成内容,展现了 AI 在个性化内容生成领域的创新应用。该功能目前面向美国用户开放,标志着 AI 在音频内容创作和个性化推荐领域的进一步落地。

来源:TechCrunch AI

1月 9日
2 条新闻
21:27

Rounded是一个AI编排平台,让任何人都能构建AI语音代理

法国初创公司 Rounded 开发了一个 AI 语音代理编排平台,允许企业构建定制化语音代理。其核心是通过整合语音转文本、大语言模型(如 GPT-4)和文本转语音技术,优化特定场景的语音交互体验。Rounded 已在医疗领域推出 AI 语音代理 Donna,用于麻醉师预约管理,显著提升了通话效率和响应速度(延迟降至 600 毫秒)。该平台支持企业选择不同 AI 模型,并通过提示工程优化代理性能,展现了 AI 语音技术在垂直领域的商业化潜力。

来源:TechCrunch AI

15:25

xAI 正在测试其Grok聊天机器人的独立iOS应用

Elon Musk 的 AI 公司 xAI 推出独立 iOS 应用 Grok,扩展其多模态生成式 AI 能力。Grok 支持实时数据访问、文本重写、段落摘要、问答及文本生成图像等功能,尤其在图像生成领域表现出色,支持逼真渲染且限制较少。xAI 计划通过 Grok.com 提供网页版访问,进一步推动 AI 助手在智能交互与内容创作领域的应用。此举标志着生成式 AI 在跨平台部署与商业化落地上的重要进展。

来源:TechCrunch AI