已选标签:
12月 31日
2 条新闻
00:00

趣丸科技「天谱乐」开创AI音乐新纪元:全球首个多模态配乐大模型

趣丸科技推出的全球首个多模态配乐大模型“天谱乐”,支持文本、图片和视频生曲,能生成高度匹配的BGM和MV效果。该技术在中文人声唱词上达到专业级效果,减少了电音感,接近音乐发行级别。“天谱乐”已接入唱鸭App,累计创作近1000万首AI歌曲。
来源:AI工具集

来源:AI工具集

12月 30日
7 条新闻
00:00

爱诗科技PixVerse V3.5上线:5秒生成高清视频,动漫效果大幅提升

爱诗科技PixVerse V3.5上线:5秒生成高清视频,动漫效果大幅提升

爱诗科技宣布其核心产品PixVerse的V3.5版本正式上线,带来显著性能提升和新功能。新版本可在5秒内生成视频,增强运动控制力,支持多种动漫风格切换,满足个性化需求。视频质量提升至1080p高清,并实现首尾帧丝滑过渡,提升整体观感。此前,爱诗科技完成近3亿元A+轮融资,资金将用于技术研发、扩展算力及人才团队建设。

来源:AI Base

00:00

Aria-UI:领先的 GUI 多模态模型,AndroidWorld 基准测试第一

Aria-UI 是一个专为 GUI 基础设计的大型多模态模型,类似于 Claude Computer use。它无需 HTML 或 AXTree 输入,采用纯视觉方法。作为 Moe 模型其速度也非常快。

在 AndroidWorld 基准测试中以 44.8% 的成功率排名第一。

官方提供了一个在线演示,确实速度挺快的,不过该技术是底层模型,没有封装成可交互的应用。

来源:三花快讯

00:00

智谱开源 CogAgent-9B-20241220:提升 GUI 感知与多语言交互能力

智谱最新开源的 CogAgent-9B-20241220 模型,类似于 Claude Computer use,在多个方面实现了显著提升。

新版本在 GUI 感知、推理预测准确性、动作空间完善性以及任务的普适和泛化性上都有大幅进步。

此外,CogAgent 能够处理中英文双语的屏幕截图和语言交互,极大地扩展了其应用范围。官方演示中,展示了如何在 MacOS 上自动调用微信给朋友发消息以及通过邮箱发送邮件。不过,目前的操作速度还比较慢,且需要提前为 AI 打开相关窗口,在 AI 操作过程中人类无法介入。

来源:三花快讯

00:00

支付宝「探一下」新一代AI视觉搜索产品,满足你的好奇心

支付宝推出新功能“探一下”,基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务:探知识、探灵感、探文本。可以根据自己的需求选择相应的服务,满足用户的好奇心。通过支付宝“扫一扫”界面或支小宝App中访问。
来源:支付宝

来源:AI工具集

00:00

商汤科技推出 Large Motion Model:统一多模态运动生成大模型

商汤科技推出 Large Motion Model:统一多模态运动生成大模型

Large Motion Model 是商汤科技推出的统一多模态运动生成模型。这一创新模型以运动为核心,构建了一个多模态框架,将主流运动生成任务整合为一个通用模型。

用户只需输入描述,即可生成一段运动姿势视频。目前,该模型已完全开源,支持多模态输入进行控制。你们可以在在线演示亲自体验一下。

来源:三花快讯

00:00

拓元智慧完成近亿元Pre-A轮融资,将聚焦多模态大模型与具身智能技术

拓元智慧(X-Era AI)宣布完成近亿元人民币的Pre-A轮融资,由粤科金融集团、鹏城愿景基金等投资。资金将用于加速多模态大模型和具身智能技术的研发。公司成立三年,累计营收近亿元,核心团队来自国内外高校和知名企业,已在无人零售、文教创作等领域实现技术深度应用。
来源:钛媒体

来源:AI工具集

12月 29日
2 条新闻
00:00

最佳iPad应用程序,释放并探索你的创造力

本文介绍了多款 iPad 创意应用,重点展示了 AI 技术在数字艺术、视频编辑和图形设计领域的创新应用。Canva 的 AI 功能如“Magic Switch”和“Magic Media”显著简化了内容创作流程,体现了多模态模型在图像生成和编辑中的潜力。Procreate 和 LumaFusion 则通过智能辅助工具(如 QuickShape、StreamLine 和音频优化)提升了创作效率和用户体验。这些应用不仅展示了 AI 在创意产业中的广泛应用,也反映了边缘计算和用户友好型 AI 工具的发展趋势,为未来更多 AI 驱动的创意解决方案奠定了基础。

来源:TechCrunch AI

00:00

如何观看2025年CES新闻发布会

CES 2025 聚焦 AI 技术前沿,NVIDIA、AMD 等巨头将展示最新突破。NVIDIA 凭借其在 AI 芯片领域的领先地位,预计将发布 RTX 5000 系列,进一步推动 AI 算力提升。AMD 则计划推出 RDNA 4 架构的 RX 8000/9000 系列 GPU,与 NVIDIA 展开竞争。三星以“AI for All: Everyday, Everywhere”为主题,展示其在消费电子和机器人领域的 AI 应用。CES 2025 将揭示 AI 技术在硬件创新、多模态融合及商业落地方面的最新趋势,推动 AI 产业生态的持续发展。

来源:TechCrunch AI