AI新闻 | 第5页 | goodux 好体验

已选标签:

12月 30日

7 条新闻

00:00

Aria-UI：领先的 GUI 多模态模型，AndroidWorld 基准测试第一

Aria-UI 是一个专为 GUI 基础设计的大型多模态模型，类似于 Claude Computer use。它无需 HTML 或 AXTree 输入，采用纯视觉方法。作为 Moe 模型其速度也非常快。

在 AndroidWorld 基准测试中以 44.8% 的成功率排名第一。

官方提供了一个在线演示，确实速度挺快的，不过该技术是底层模型，没有封装成可交互的应用。

来源：三花快讯

00:00

PixVerse V3.5 正式上线，模型全面升级，10秒极速生成

爱诗科技宣布PixVerse V3.5版本正式上线，新版本在Turbo模式下10秒内即可生成高质量视频，保持行业领先的语义理解和细节表现力。动漫生成效果显著提升，支持通过文生视频描述特定风格或上传图片生成动漫效果。新增首尾帧功能，激发创作灵感。
来源：爱诗科技 AIsphere

来源：AI工具集

00:00

讯飞医疗成功上市，成为医疗大模型第一股！

讯飞医疗科技股份有限公司（股票代码：02506.HK）于2024年12月30日在香港联交所主板成功上市，标志着医疗大模型领域的第一股诞生。作为中国医疗人工智能行业的领导者，讯飞医疗在基层医疗服务、医院服务、患者服务和智慧影像等方面均取得显著成就，致力于让医疗服务更便捷，为人类健康未来奋斗。
来源：科大讯飞

来源：AI工具集

00:00

爱诗科技PixVerse V3.5上线：5秒生成高清视频，动漫效果大幅提升

爱诗科技宣布其核心产品PixVerse的V3.5版本正式上线，带来显著性能提升和新功能。新版本可在5秒内生成视频，增强运动控制力，支持多种动漫风格切换，满足个性化需求。视频质量提升至1080p高清，并实现首尾帧丝滑过渡，提升整体观感。此前，爱诗科技完成近3亿元A+轮融资，资金将用于技术研发、扩展算力及人才团队建设。

来源：AI Base

00:00

商汤科技推出 Large Motion Model：统一多模态运动生成大模型

Large Motion Model 是商汤科技推出的统一多模态运动生成模型。这一创新模型以运动为核心，构建了一个多模态框架，将主流运动生成任务整合为一个通用模型。

用户只需输入描述，即可生成一段运动姿势视频。目前，该模型已完全开源，支持多模态输入进行控制。你们可以在在线演示亲自体验一下。

来源：三花快讯

00:00

智谱开源 CogAgent-9B-20241220：提升 GUI 感知与多语言交互能力

智谱最新开源的 CogAgent-9B-20241220 模型，类似于 Claude Computer use，在多个方面实现了显著提升。

新版本在 GUI 感知、推理预测准确性、动作空间完善性以及任务的普适和泛化性上都有大幅进步。

此外，CogAgent 能够处理中英文双语的屏幕截图和语言交互，极大地扩展了其应用范围。官方演示中，展示了如何在 MacOS 上自动调用微信给朋友发消息以及通过邮箱发送邮件。不过，目前的操作速度还比较慢，且需要提前为 AI 打开相关窗口，在 AI 操作过程中人类无法介入。

来源：三花快讯

00:00

腾讯开源 StereoCrafter：一键将普通视频转为 3D 视频

StereoCrafter 是腾讯开源的一个强大模型，能够将任何普通视频转换为红蓝、VR 或左右格式的 3D 视频。

官方还演示了将生成的视频在 Apple Vision Pro 中播放的效果，展示了其在实际应用中的潜力。该模型现已在 Hugging Face 上开放，感兴趣的朋友可以亲自跑一下。

来源：三花快讯

12月 29日

2 条新闻

00:00

本文介绍了多款 iPad 创意应用，重点展示了 AI 技术在数字艺术、视频编辑和图形设计领域的创新应用。Canva 的 AI 功能如“Magic Switch”和“Magic Media”显著简化了内容创作流程，体现了多模态模型在图像生成和编辑中的潜力。Procreate 和 LumaFusion 则通过智能辅助工具（如 QuickShape、StreamLine 和音频优化）提升了创作效率和用户体验。这些应用不仅展示了 AI 在创意产业中的广泛应用，也反映了边缘计算和用户友好型 AI 工具的发展趋势，为未来更多 AI 驱动的创意解决方案奠定了基础。

来源：TechCrunch AI

00:00

谷歌CEO表示，AI模型Gemini将是公司2025年的“最大重点”

Google CEO Sundar Pichai 强调 2025 年将是公司 AI 发展的关键年，重点在于加速 Gemini 模型的规模化应用，特别是在消费者领域。Pichai 承认 Google 在 AI 领域仍需追赶，并指出 Gemini 虽具备强劲势头，但需在 2025 年进一步缩小差距，确立领导地位。这一战略反映了科技巨头在 AI 领域的激烈竞争，以及大语言模型在商业落地和技术创新中的核心作用。

来源：TechCrunch AI

« 上一页
1
…
3
4
5