已选标签:
1月 20日
3 条新闻
13:49

通义:一分钟生成互动2D卡通角色,Textoon引领新潮流

您的浏览器不支持视频播放。

2D卡通风格在数字角色创作中备受青睐,尤其受年轻观众欢迎。尽管3D技术发展迅速,但Live2D格式的2D卡通角色因其高效、轻量的特点,提供了模拟3D运动的动画效果,无需构建完整的3D模型。最新推出的Textoon方法,基于文本描述生成多样化的2D卡通角色,利用先进的语言和视觉模型,快速生成生动互动的角色,显著提升了创作效率与多样性。

来源:github

11:23

MangaNinja:开源线稿上色工具

MangaNinja 是一款创新的开源线稿上色工具,它允许用户通过输入线稿和参考图片来生成与参考图一致的颜色。 该工具支持多角色草图参考多张图片和单角色草图参考多张图片。 佬们可以看下视频演示,感受下网球王子版的智爷。此外,这里还有个在线 Demo。

来源:三花快讯

11:23

黑森林实验室推出 FLUX Pro Finetuning API:轻松定制你的图像模型

黑森林实验室(Black Forest Labs)最新发布的 FLUX Pro Finetuning API,让任何人都能轻松使用自己的图片来定制 FLUX Pro 模型。 这个 API 的亮点在于它的易用性和灵活性,最简单的例子就是你可以把你的 logo 融入生成的图像中,实现营销和推广。想了解更多详情,可以查看官方博客。

来源:三花快讯

1月 19日
1 条新闻
23:01

新论文发现人工智能在历史方面表现不佳

最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。

来源:TechCrunch AI

1月 15日
4 条新闻
22:33

岩鱼正在帮助企业利用合成数据

Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。

来源:TechCrunch AI

09:00

Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生

Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。

来源:TechCrunch AI

05:47

任天堂Switch 2或于本周公布:截至目前的传闻与事实

任天堂Switch 2或于本周公布:截至目前的传闻与事实

Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。

来源:TechCrunch AI

02:18

拜登政府开放联邦土地用于人工智能数据中心

美国总统拜登签署行政命令,允许私营 AI 公司租赁国防部和能源部拥有的联邦场地建设 AI 数据中心,要求匹配清洁能源使用。此举旨在强化美国在 AI 领域的全球领导地位,减少对外国基础设施的依赖。行政命令强调可再生能源使用,以应对数据中心能耗激增的挑战(预计未来五年能耗翻倍)。同时,拜登政府还收紧了对 AI 芯片出口的限制,进一步保护本国 AI 产业竞争力。此举可能面临新政府政策调整的挑战。

来源:TechCrunch AI

1月 13日
6 条新闻
19:02

CoreWeave的首个国际数据中心在英国正式上线

CoreWeave 在英国开设首批数据中心,标志着其首次扩展至美国以外市场。这些数据中心采用 Nvidia 的 Hopper GPU,专为高性能计算和 AI 工作负载设计。此举与英国政府五年投资计划同步,旨在提升政府拥有的 AI 计算能力并推动 AI 基础设施发展。CoreWeave 从加密货币挖矿转型为 AI 计算服务提供商,反映了 AI 计算需求的激增。公司计划在 2025 年新增 10 个数据中心,其中 3 个位于欧洲。这一扩展凸显了 AI 基础设施在全球范围内的快速增长和重要性。

来源:TechCrunch AI

18:45

英国投身人工智能浪潮

英国政府宣布大规模 AI 投资计划,旨在通过 AI 推动公共部门服务升级,并设立“AI 增长区”以加速数据中心和研发基础设施建设。计划包括 20 倍提升公共算力、建设新超级计算机及国家数据图书馆,以支持 AI 开发。政府强调 AI 对经济现代化的关键作用,并吸引包括 Anthropic 和 Cohere 在内的国际企业投资。此举标志着英国从 AI 安全讨论转向积极拥抱 AI 技术,力图在全球 AI 竞赛中占据领先地位。

来源:TechCrunch AI

09:47

Adobe FaceLift:单张照片生成高保真 3D 头部模型

Adobe FaceLift:单张照片生成高保真 3D 头部模型

FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。

该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。

此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。

从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。

来源:三花快讯

1月 11日
1 条新闻
23:00

英伟达的AI帝国:聚焦其顶级初创投资

Nvidia 在生成式 AI 浪潮中迅速崛起,成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来,其营收和股价大幅增长,并显著加大了对 AI 初创企业的投资。2024 年,Nvidia 参与了 49 轮 AI 公司融资,远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业,以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统,推动大模型、自动驾驶、AI 基础设施等技术的商业化落地,展现了其在 AI 产业链中的核心地位。

来源:TechCrunch AI

1月 10日
2 条新闻
09:54

百度与复旦大学联合开源 Hello3:革命性数字人头动画技术

Hello3 是复旦大学和百度联合开源的数字人头(肖像动画)技术,能让静态肖像在各种场景下动起来,而且动作自然、画面逼真。它不仅能处理正面肖像,还能应对各种角度和姿态,甚至能让肖像与周围物体互动。

与之前的 Hallo2 相比,Hallo3 在生成动态场景和沉浸式背景方面有了显著提升,让肖像动画不再局限于简单的表情变化,而是能将角色也融入到场景中。

来源:三花快讯

00:03

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客

Google 正在测试基于 AI 的“Daily Listen”功能,通过用户 Discover 订阅内容自动生成个性化播客。该功能利用大语言模型和多模态技术,将用户兴趣转化为 5 分钟音频摘要,并附带相关故事链接。Daily Listen 与 NotebookLM 的 Audio Overviews 类似,均通过 AI 虚拟主持人生成内容,展现了 AI 在个性化内容生成领域的创新应用。该功能目前面向美国用户开放,标志着 AI 在音频内容创作和个性化推荐领域的进一步落地。

来源:TechCrunch AI

1月 9日
3 条新闻
21:27

Rounded是一个AI编排平台,让任何人都能构建AI语音代理

法国初创公司 Rounded 开发了一个 AI 语音代理编排平台,允许企业构建定制化语音代理。其核心是通过整合语音转文本、大语言模型(如 GPT-4)和文本转语音技术,优化特定场景的语音交互体验。Rounded 已在医疗领域推出 AI 语音代理 Donna,用于麻醉师预约管理,显著提升了通话效率和响应速度(延迟降至 600 毫秒)。该平台支持企业选择不同 AI 模型,并通过提示工程优化代理性能,展现了 AI 语音技术在垂直领域的商业化潜力。

来源:TechCrunch AI

15:25

xAI 正在测试其Grok聊天机器人的独立iOS应用

Elon Musk 的 AI 公司 xAI 推出独立 iOS 应用 Grok,扩展其多模态生成式 AI 能力。Grok 支持实时数据访问、文本重写、段落摘要、问答及文本生成图像等功能,尤其在图像生成领域表现出色,支持逼真渲染且限制较少。xAI 计划通过 Grok.com 提供网页版访问,进一步推动 AI 助手在智能交互与内容创作领域的应用。此举标志着生成式 AI 在跨平台部署与商业化落地上的重要进展。

来源:TechCrunch AI