1月
15日
2 条新闻
01:51
Apple 加入 Ultra Accelerator Link 联盟,推动 AI 数据中心芯片互联技术 UALink 的发展。UALink 旨在通过开放标准连接 GPU 和定制芯片,加速 AI 模型的训练、微调和推理。联盟成员包括 Intel、AMD、Google 等科技巨头,但 Nvidia 未参与。Apple 的加入与其 AI 基础设施投资战略一致,包括开发新型服务器芯片以提升 AI 数据中心效率。UALink 预计未来几年推出首批产品,有望解决 AI 算力扩展中的连接瓶颈,推动 AI 能力提升。
01:49
24岁创业者退出首家公司加入Coinbase,为其新项目筹集300万美元
Pryce Yebesi 新创公司 Open Ledger 推出 AI 驱动的模块化会计工具,嵌入企业现有产品中,提供自动化分类、对账和财务报告功能。通过优化数据层,结合 LLM 技术,Open Ledger 解决了传统会计软件的效率和安全问题,目标为中小型企业提供高效、安全的财务管理解决方案。公司已获 300 万美元融资,计划扩展团队并支持百万级用户。
1月
13日
4 条新闻
23:25
穆迪同意收购Cape Analytics,该公司为保险提供商开发地理空间人工智能技术
Moody’s 收购地理空间 AI 初创公司 Cape Analytics,旨在利用其 AI 技术优化保险承保流程。Cape 通过卫星图像和算法提取结构化数据,生成详细的物业信息数据库,为保险公司提供精准风险评估。此次收购反映了保险行业加速 AI 应用的趋势,预计到 2032 年全球 AI 保险市场规模将达 798.6 亿美元。尽管 AI 可能引入偏见,但其在提升理赔效率和整体运营效率方面的潜力推动了行业应用。Cape 的技术结合 Moody’s 的全球资源,有望进一步扩展国际市场,并深化在金融领域的应用。
20:06
更多资金注入AI医疗:Qventus以超4亿美元估值获得1.05亿美元融资
AI 医疗初创公司 Qventus 完成 1.05 亿美元 D 轮融资,估值超 4 亿美元,资金将用于扩展 AI 助手在手术、住院/门诊管理等场景的应用。公司通过机器学习和生成式 AI 技术,优化临床和管理工作流程,提升效率。生成式 AI 的引入增强了处理非结构化数据的能力,支持实时响应临床需求。此次融资凸显了 AI 医疗领域的投资热度,Qventus 客户增长四倍,核心业务增长三倍,接近盈亏平衡。
09:47
快手 Kling APP 登陆美区 App Store,安卓版即将推出
Kling APP 现已正式上架美区 App Store,安卓版本也即将上线。
简单体验了一下,和 Web 版本差不多,支持 kolors 1.5 生成图片和 kling 1.6 生成图生视频、文生视频。
09:47
Adobe FaceLift:单张照片生成高保真 3D 头部模型
FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。
该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。
此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。
从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。
1月
12日
1 条新闻
05:30
研究人员开源Sky-T1,一款训练成本低于450美元的“推理”AI模型
UC Berkeley 的 NovaSky 团队开源了推理 AI 模型 Sky-T1-32B-Preview,展示了低成本高效训练推理模型的突破。该模型在 MATH500 数学挑战和 LiveCodeBench 编码评估中表现优异,训练成本仅 450 美元,显著低于传统百万美元级成本。Sky-T1 通过自检机制提升可靠性,适用于物理、科学和数学领域。团队计划进一步优化模型效率与准确性,推动开源推理模型的发展。
1月
11日
1 条新闻
01:24
50亿美元直播购物应用、英伟达的发布以及 CES 上最奇特的技术
CES 2025 展示了 AI 技术的多样化应用与创新趋势,包括智能家居设备(如机器人吸尘器)和智能眼镜等消费级产品。Nvidia 的 Project Digits 项目预示了 AI 在边缘计算和实时交互领域的潜力,可能推动未来初创企业的技术突破。尽管部分企业仍处于实验阶段,但 AI 在提升用户体验和优化硬件性能方面的进展显著。此外,Meta 的‘更多言论,更少错误’策略反映了 AI 在内容审核和自然语言处理中的持续优化需求。
1月
10日
4 条新闻
10:11
特斯拉在中国推出新款Model Y
特斯拉发布新款 Model Y,针对亚太市场进行设计更新,重点优化了自动驾驶相关硬件和软件集成。新车采用与 Cybertruck 相似的连续灯条设计,提升了视觉识别系统的兼容性。内饰新增后排触控屏,可能整合了多模态交互功能。此次更新反映了特斯拉在自动驾驶技术上的持续投入,同时通过轻量化设计和悬挂优化,提升了 AI 系统的感知精度和决策效率。特斯拉正加速 AI 技术在汽车领域的商业化落地,以应对日益激烈的市场竞争。
09:54
Dify v1.0.0-beta 发布:全新 Marketplace 和插件系统上线
Dify Marketplace 发布了 v1.0.0-beta 版本,带来了全新的插件系统。现在,模型和工具等都成为了插件系统的一部分,用户可以更方便地扩展和定制功能。好久没关注 Dify 了,终于快要正式版了!
08:52
希波克拉底人工智能筹集1.41亿美元用于创建面向患者的AI代理
Hippocratic AI 完成 1.41 亿美元 B 轮融资,估值达 16.4 亿美元,专注于开发面向患者的非诊断性 AI 解决方案。该公司通过生成式 AI 技术,创建能够执行术前准备、远程患者监控等任务的智能代理,缓解医疗专业人员短缺问题。其技术核心在于利用大语言模型和强化学习优化医疗流程,目前已与 23 家医疗系统和保险公司达成合作。未来,Hippocratic AI 计划扩展国际市场,推动 AI 在医疗领域的规模化应用。
08:31
英伟达的AI头像出现在我的电脑屏幕上,让我感到十分诡异
Nvidia 在 CES 2025 上推出桌面 AI 助手 R2X,结合生成式游戏技术与大语言模型(如 GPT-4o 和 Grok),提供多模态交互能力。R2X 支持文本、语音输入,可处理文件、实时屏幕分析,并集成检索增强生成(RAG)技术。尽管原型存在视觉和功能缺陷(如屏幕识别错误),Nvidia 计划 2025 年上半年开源该技术,推动开发者生态。R2X 展示了 AI 助手在桌面应用中的潜力,但也凸显了多模态模型在实时交互和准确性上的技术挑战。
1月
9日
8 条新闻
21:27
Rounded是一个AI编排平台,让任何人都能构建AI语音代理
法国初创公司 Rounded 开发了一个 AI 语音代理编排平台,允许企业构建定制化语音代理。其核心是通过整合语音转文本、大语言模型(如 GPT-4)和文本转语音技术,优化特定场景的语音交互体验。Rounded 已在医疗领域推出 AI 语音代理 Donna,用于麻醉师预约管理,显著提升了通话效率和响应速度(延迟降至 600 毫秒)。该平台支持企业选择不同 AI 模型,并通过提示工程优化代理性能,展现了 AI 语音技术在垂直领域的商业化潜力。
09:14
Adobe 发布 TransPixar:生成透明背景视频的创新技术
TransPixar 是 Adobe 最新发布的一项创新技术,能够通过文本和图像生成透明背景的视频。
不仅支持创建烟雾和反射等透明元素,还提供了高度逼真的视觉效果。可以看看演示视频,效果相当不错。也可以在 Hugging Face 体验在线版本,不过在线版限制了帧率和推理步骤。代码是开源的,有兴趣的可以直接本地部署。
09:14
Gazelle 多人注视检测技术在线版本发布,精准检测目光方向
Gazelle 是一个开源的多人注视检测技术,能够精准地检测人们的目光方向和注视对象。
现在,Gazelle 的在线版本已经发布,社区提供了两个不同的演示:gaze-demo 和 Gaze-LLE-demo。
09:14
字节跳动开源 S T A R 视频超分模型:利用 T2V 技术实现高清修复
S T A R 是字节跳动开源的一个利用 T2V(Text-to-Video)模型对视频进行超分辨率的方法。无论是 AI 生成的视频还是现实中的视频,S T A R 都能进行高清修复。预训练模型(基于 I2VGen-XL 和 CogVideoX-5B)及推理代码现已发布,有兴趣的佬友可以自己试试。
09:14
微软开源 phi-4 模型:14B 参数,性能超越 GPT-4o
phi-4 是微软刚刚开源的最强小参数模型,其参数仅为 14B。
在各种基准测试中,phi-4 对比同参数量的模型表现优异,甚至在 GPQA 和 MATH 基准测试中超过了 GPT-4o。这个模型最初于去年 12 月 12 日发布,现在竟然直接开源了,并且基于 MIT 协议,可随意商用。
05:33
Grok可能很快会推出“无拘模式”
xAI 推出的 Grok 聊天机器人即将推出 ‘Unhinged Mode’,旨在提供更具争议性和冒犯性的回答,突破传统 AI 的过滤限制。该模式反映了 Elon Musk 对 AI 的愿景,即打破 ‘政治正确’ 的束缚,提供更直接、未经过滤的对话体验。然而,Grok 目前仍受限于其训练数据(公开网页),导致其在政治敏感话题上表现出左倾倾向。Musk 承诺将调整模型以实现政治中立。这一发展凸显了 AI 在内容生成和伦理规范方面的挑战,特别是在平衡言论自由与社会责任之间的复杂关系。
02:05
本周人工智能:更强大的AI即将到来,但其益处能否均衡分布?
OpenAI CEO Sam Altman 宣布公司已掌握构建通用人工智能(AGI)的技术路径,并开始瞄准超级智能(Superintelligence)。AGI 被定义为在大多数经济价值工作中超越人类的自主系统,而超级智能则可能大幅加速创新。然而,近期研究表明,AI 对自由职业者的影响呈现“拐点效应”:初期提升收入,但后期可能取代工作岗位,如翻译领域收入下降 30%。此外,GPT-4 在金融领域的应用显示,AI 辅助可显著提升专家决策效率。随着 AI 能力提升,如何确保其收益广泛分配成为关键挑战。
01:05
实时更新 CES 2025:英伟达、人工智能、电动汽车发布及更多第二天动态
CES 2025 展示了 AI 技术的多样化应用与创新趋势。Nvidia CEO 强调其系统性能超越摩尔定律,通过全栈创新推动 AI 算力提升。Delta Air Lines 推出 AI 助手,优化用户体验并整合 Uber 服务。AI 在宠物科技领域也取得进展,如 Birdfy 的 AI 鸟类识别系统。此外,Waymo-Zeekr 合作的自动驾驶出租车亮相,突显 AI 在交通领域的突破。整体来看,AI 正加速渗透至消费、交通、娱乐等多个场景,推动产业智能化升级。