已选标签:
12月 30日
6 条新闻
00:00

支付宝「探一下」新一代AI视觉搜索产品,满足你的好奇心

支付宝推出新功能“探一下”,基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务:探知识、探灵感、探文本。可以根据自己的需求选择相应的服务,满足用户的好奇心。通过支付宝“扫一扫”界面或支小宝App中访问。
来源:支付宝

来源:AI工具集

00:00

英伟达的下一步:为类人机器人提供动力

Nvidia 宣布将于 2025 年上半年推出新一代紧凑型计算机 Jetson Thor,专为人形机器人设计。这一举措标志着 Nvidia 在机器人领域的深入布局,旨在为全球数十万机器人制造商提供底层技术支持。Nvidia 副总裁 Deepu Talla 指出,这一战略得益于生成式 AI 模型的爆发式增长,以及利用模拟环境训练机器人的能力。此举也反映了 Nvidia 在 AI 芯片市场竞争加剧的背景下,通过机器人技术拓展业务版图的战略意图。

来源:TechCrunch AI

00:00

Aria-UI:领先的 GUI 多模态模型,AndroidWorld 基准测试第一

Aria-UI 是一个专为 GUI 基础设计的大型多模态模型,类似于 Claude Computer use。它无需 HTML 或 AXTree 输入,采用纯视觉方法。作为 Moe 模型其速度也非常快。

在 AndroidWorld 基准测试中以 44.8% 的成功率排名第一。

官方提供了一个在线演示,确实速度挺快的,不过该技术是底层模型,没有封装成可交互的应用。

来源:三花快讯

00:00

智谱开源 CogAgent-9B-20241220:提升 GUI 感知与多语言交互能力

智谱最新开源的 CogAgent-9B-20241220 模型,类似于 Claude Computer use,在多个方面实现了显著提升。

新版本在 GUI 感知、推理预测准确性、动作空间完善性以及任务的普适和泛化性上都有大幅进步。

此外,CogAgent 能够处理中英文双语的屏幕截图和语言交互,极大地扩展了其应用范围。官方演示中,展示了如何在 MacOS 上自动调用微信给朋友发消息以及通过邮箱发送邮件。不过,目前的操作速度还比较慢,且需要提前为 AI 打开相关窗口,在 AI 操作过程中人类无法介入。

来源:三花快讯

00:00

获得a16z和QED支持的巴西初创公司Carecode将AI代理应用于医疗保健领域

巴西初创公司 Carecode 利用 AI 代理优化医疗预约前后的任务,如预约安排和确认,显著降低医疗成本并提升效率。其 AI 系统通过 WhatsApp 支持文本和语音消息,适应巴西用户习惯,尤其针对老年和低收入群体。Carecode 的垂直聚焦策略使其在医疗领域构建竞争壁垒,未来可能扩展至保险、支付等相关领域。该技术展示了 AI 在医疗辅助任务中的潜力,特别是在降低运营成本和提升用户体验方面的创新应用。

来源:TechCrunch AI

12月 29日
1 条新闻
00:00

Joco 曾差点在推出时夭折,如今已成为电动自行车配送员的生命线——以及一项盈利的业务

Joco 是一家专注于电动自行车共享和最后一英里配送的初创公司,通过 AI 驱动的车队管理技术优化运营效率。其核心创新包括智能充电柜和电池管理系统,解决了城市中因不安全充电引发的电池火灾问题。Joco 的 AI 技术不仅提升了配送效率,还通过数据分析优化车辆调度和维护,降低了运营成本。未来,Joco 计划将 AI 技术扩展至国际市场,进一步推动电动交通工具的智能化管理。

来源:TechCrunch AI