已选标签:
1月 9日
1 条新闻
1月 8日
1 条新闻
09:43

英伟达开源 Cosmos 世界模型:助力机器人与自动驾驶数据生成

英伟达开源了 Cosmos 世界模型,这模型支持文生视频和文+视频生视频,主要应用于机器人和自动驾驶领域的大规模合成数据生成。

目前,英伟达已经开放了多个不同的预训练模型,这些模型均支持商业用途。佬友们也可以在线体验下,看看这个模型的实际效果如何。

来源:三花快讯

1月 6日
5 条新闻
10:35

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

由阿里巴巴达摩院实习生孙朝阳等人开发的SHMT模型,采用隐式扩散模型实现自监督层级化妆迁移,已被NeurIPS2024接收。项目包含训练、测试代码及预训练模型,已开源并验证可正常训练和推理。此外,团队在CVPR2024、TNNLS2023和AAAI2022也有相关成果发布。代码链接:https://github.com/Snowfallingplum/SHMT

来源:GitHub

1月 4日
1 条新闻
00:00

生成式人工智能投资在2024年达到新高

2024 年生成式 AI 投资创历史新高,全球融资达 560 亿美元,同比增长 192%。OpenAI、Anthropic、xAI 等头部企业持续获得大额融资并推出创新产品。美国公司占据主导地位,但中国、欧洲等地也有 Moonshot AI、Mistral 等企业获得显著投资。生成式 AI 在编程助手、媒体创作等垂直领域竞争加剧,但技术挑战和高计算成本可能限制中小企业的持续创新。基础设施层企业(如数据中心)受益显著,预计全球 AI 数据中心年支出将达 2500 亿美元。未来,行业可能面临估值泡沫和技术瓶颈的双重挑战。

来源:TechCrunch AI

1月 2日
1 条新闻
00:00

创新插件VMix:大幅提升生成图像的美学质量

创新插件VMix:大幅提升生成图像的美学质量

字节跳动与中科大团队推出VMix,通过新颖的价值混合交叉注意力机制,显著提升扩散模型生成图像的美学质量。VMix能系统性增强图像的颜色、光线和构图等细节维度,弥合生成图像与现实美学之间的差距。该插件无需重新训练即可应用于社区模型,实验表明其效果优于现有方法,并兼容LoRA、ControlNet等模块。VMix通过分离文本提示中的内容描述和美学描述,优化去噪过程,从而在保持图像与文本对齐的同时,大幅提高视觉表现。
1月 1日
1 条新闻
00:00

威尔·史密斯吃意大利面及其他在2024年走红的奇特AI基准测试

2024年,AI视频生成技术取得显著进展,Google Veo 2等模型成功实现逼真的Will Smith吃意大利面视频生成,成为社区热门基准。此外,AI在游戏设计(如Minecraft)和互动游戏(如Pictionary)中的应用也引发关注。尽管学术界存在更严谨的AI性能测试,但这些非正式基准因其娱乐性和易理解性而广受欢迎。专家指出,AI社区应更关注AI的实际下游影响,而非局限于狭窄领域的性能测试。未来,随着AI技术的复杂性和应用场景的扩展,如何将其转化为易于理解的营销信息仍是行业挑战。

来源:TechCrunch AI

12月 31日
5 条新闻
00:00

AI Game DevTools:一站式 AI 游戏开发资源导航

AI Game DevTools 是一份精心收集的与 AI 游戏开发相关的项目导航,涵盖了大模型、Agent、3D 资源、视频、动画等多个领域。作者们贴心地为所有工具列出了来源、简介、论文以及适用的游戏引擎,简直是游戏开发者的福音!如果你正在做游戏开发,不妨看看这些工具,说不定对你有帮助嗷。

来源:三花快讯

12月 30日
5 条新闻
00:00

支付宝「探一下」新一代AI视觉搜索产品,满足你的好奇心

支付宝推出新功能“探一下”,基于自研的多模态大模型技术,能够“用AI之眼探索万物”,提供快速、有用、趣味的生成式搜索服务。“探一下”提供三种核心服务:探知识、探灵感、探文本。可以根据自己的需求选择相应的服务,满足用户的好奇心。通过支付宝“扫一扫”界面或支小宝App中访问。
来源:支付宝

来源:AI工具集

00:00

爱诗科技PixVerse V3.5上线:5秒生成高清视频,动漫效果大幅提升

爱诗科技PixVerse V3.5上线:5秒生成高清视频,动漫效果大幅提升

爱诗科技宣布其核心产品PixVerse的V3.5版本正式上线,带来显著性能提升和新功能。新版本可在5秒内生成视频,增强运动控制力,支持多种动漫风格切换,满足个性化需求。视频质量提升至1080p高清,并实现首尾帧丝滑过渡,提升整体观感。此前,爱诗科技完成近3亿元A+轮融资,资金将用于技术研发、扩展算力及人才团队建设。

来源:AI Base

00:00

英伟达的下一步:为类人机器人提供动力

Nvidia 宣布将于 2025 年上半年推出新一代紧凑型计算机 Jetson Thor,专为人形机器人设计。这一举措标志着 Nvidia 在机器人领域的深入布局,旨在为全球数十万机器人制造商提供底层技术支持。Nvidia 副总裁 Deepu Talla 指出,这一战略得益于生成式 AI 模型的爆发式增长,以及利用模拟环境训练机器人的能力。此举也反映了 Nvidia 在 AI 芯片市场竞争加剧的背景下,通过机器人技术拓展业务版图的战略意图。

来源:TechCrunch AI

00:00

商汤科技推出 Large Motion Model:统一多模态运动生成大模型

商汤科技推出 Large Motion Model:统一多模态运动生成大模型

Large Motion Model 是商汤科技推出的统一多模态运动生成模型。这一创新模型以运动为核心,构建了一个多模态框架,将主流运动生成任务整合为一个通用模型。

用户只需输入描述,即可生成一段运动姿势视频。目前,该模型已完全开源,支持多模态输入进行控制。你们可以在在线演示亲自体验一下。

来源:三花快讯