1月
21日
1 条新闻
01:44
中国AI实验室DeepSeek发布开源推理模型DeepSeek-R1,声称在AIME、MATH-500和SWE-bench等基准测试中表现优于OpenAI的o1。R1具备6710亿参数,支持自我事实核查,适用于物理、科学和数学领域。DeepSeek还发布了参数从15亿到700亿不等的精简版本,最小版本可在笔记本电脑上运行。尽管R1在性能和成本上具有优势,但其响应受中国互联网监管限制。此举正值美国对华AI技术出口限制加剧,凸显中美在AI领域的竞争态势。
1月
20日
3 条新闻
13:49
通义:一分钟生成互动2D卡通角色,Textoon引领新潮流
您的浏览器不支持视频播放。
2D卡通风格在数字角色创作中备受青睐,尤其受年轻观众欢迎。尽管3D技术发展迅速,但Live2D格式的2D卡通角色因其高效、轻量的特点,提供了模拟3D运动的动画效果,无需构建完整的3D模型。最新推出的Textoon方法,基于文本描述生成多样化的2D卡通角色,利用先进的语言和视觉模型,快速生成生动互动的角色,显著提升了创作效率与多样性。
11:23
MangaNinja:开源线稿上色工具
MangaNinja 是一款创新的开源线稿上色工具,它允许用户通过输入线稿和参考图片来生成与参考图一致的颜色。 该工具支持多角色草图参考多张图片和单角色草图参考多张图片。 佬们可以看下视频演示,感受下网球王子版的智爷。此外,这里还有个在线 Demo。
11:23
黑森林实验室推出 FLUX Pro Finetuning API:轻松定制你的图像模型
黑森林实验室(Black Forest Labs)最新发布的 FLUX Pro Finetuning API,让任何人都能轻松使用自己的图片来定制 FLUX Pro 模型。 这个 API 的亮点在于它的易用性和灵活性,最简单的例子就是你可以把你的 logo 融入生成的图像中,实现营销和推广。想了解更多详情,可以查看官方博客。
1月
19日
2 条新闻
23:01
新论文发现人工智能在历史方面表现不佳
最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。
15:56
苹果列出在美国与TikTok一同下架的所有应用
苹果因美国《保护美国人免受外国对手控制应用法案》下架 TikTok 及其关联应用,包括 AI 学习助手 Gauth 等。此举凸显了 AI 应用在数据安全与合规性方面的挑战,尤其是涉及跨境数据流动和用户隐私保护。AI 技术的全球化部署需应对复杂的法律环境,同时推动联邦学习等隐私保护技术的发展。
1月
15日
6 条新闻
22:33
岩鱼正在帮助企业利用合成数据
Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。
09:00
Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生
Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。
05:47
任天堂Switch 2或于本周公布:截至目前的传闻与事实
Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。
05:41
法院文件揭示Meta高管内部痴迷于击败OpenAI的GPT-4
Meta 在开发 Llama 3 过程中,内部消息显示其高管和研究人员高度聚焦于超越 OpenAI 的 GPT-4 模型,强调通过大规模 GPU 资源(64k)提升模型性能。Meta 的目标是打造前沿 AI 模型,超越 Anthropic 和 OpenAI 等闭源竞争对手,同时轻视开源竞争对手 Mistral。内部讨论还涉及数据集的优化,包括使用可能涉及版权的 LibGen 数据集。Meta CEO 扎克伯格表示,Llama 3 已在 2024 年与行业领先模型竞争,并计划未来成为最先进的 AI 模型。然而,Meta 在模型训练中使用的数据正面临多起版权诉讼。
01:51
苹果加入联盟助力开发下一代人工智能数据中心技术
Apple 加入 Ultra Accelerator Link 联盟,推动 AI 数据中心芯片互联技术 UALink 的发展。UALink 旨在通过开放标准连接 GPU 和定制芯片,加速 AI 模型的训练、微调和推理。联盟成员包括 Intel、AMD、Google 等科技巨头,但 Nvidia 未参与。Apple 的加入与其 AI 基础设施投资战略一致,包括开发新型服务器芯片以提升 AI 数据中心效率。UALink 预计未来几年推出首批产品,有望解决 AI 算力扩展中的连接瓶颈,推动 AI 能力提升。
00:45
获得3000万美元新融资后,SEEQC认为芯片是构建实用量子计算机的关键
量子计算初创公司 SEEQC 宣布获得 3000 万美元融资,致力于通过芯片技术简化量子硬件复杂性,推动量子计算与经典计算的融合。SEEQC 与 Nvidia 合作开发超低延迟芯片间连接技术,旨在提升量子计算与 GPU 的协同效率,支持数据中心和企业级应用。量子计算有望加速新材料和药物研发,德国化工巨头 BASF 和 Merck 已参与 SEEQC 主导的 QuPharma 项目。SEEQC 的技术源于 Hypres 的成熟芯片制造能力,未来将加速商业化进程,推动量子计算在 AI 和数据中心领域的应用。
1月
13日
4 条新闻
09:47
Adobe FaceLift:单张照片生成高保真 3D 头部模型
FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。
该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。
此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。
从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。
09:47
阿里通义团队推出 Qwen Chat:支持全系列 Qwen 模型
Qwen Chat 是阿里通义团队近日上线的一款基于开源的 Open WebUI 的 WebUI,支持 Qwen 全系列模型。
模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型,以及 Qwen2.5-Coder-32B-Instruct 编程模型。
Qwen Chat 支持同时对比多个模型,还即将推出网络搜索、图像生成和语音模式,值得期待。
09:47
快手 Kling APP 登陆美区 App Store,安卓版即将推出
Kling APP 现已正式上架美区 App Store,安卓版本也即将上线。
简单体验了一下,和 Web 版本差不多,支持 kolors 1.5 生成图片和 kling 1.6 生成图生视频、文生视频。
09:47
xAI 发布 Grok iOS 应用,支持图像生成与实时数据访问
Grok iOS App 现已上线美区 App Store,支持生成图像和对话。用户需要使用 X 账号登录,以实时访问 X 和 Web 数据。
系统版本要求较高,需更新至 iOS 17 才能安装,如果你在用巨魔啥的就无缘了。安卓版本即将推出。
1月
12日
1 条新闻
05:30
研究人员开源Sky-T1,一款训练成本低于450美元的“推理”AI模型
UC Berkeley 的 NovaSky 团队开源了推理 AI 模型 Sky-T1-32B-Preview,展示了低成本高效训练推理模型的突破。该模型在 MATH500 数学挑战和 LiveCodeBench 编码评估中表现优异,训练成本仅 450 美元,显著低于传统百万美元级成本。Sky-T1 通过自检机制提升可靠性,适用于物理、科学和数学领域。团队计划进一步优化模型效率与准确性,推动开源推理模型的发展。
1月
11日
1 条新闻
23:00
英伟达的AI帝国:聚焦其顶级初创投资
Nvidia 在生成式 AI 浪潮中迅速崛起,成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来,其营收和股价大幅增长,并显著加大了对 AI 初创企业的投资。2024 年,Nvidia 参与了 49 轮 AI 公司融资,远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业,以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统,推动大模型、自动驾驶、AI 基础设施等技术的商业化落地,展现了其在 AI 产业链中的核心地位。
1月
10日
2 条新闻
09:54
百度与复旦大学联合开源 Hello3:革命性数字人头动画技术
Hello3 是复旦大学和百度联合开源的数字人头(肖像动画)技术,能让静态肖像在各种场景下动起来,而且动作自然、画面逼真。它不仅能处理正面肖像,还能应对各种角度和姿态,甚至能让肖像与周围物体互动。
与之前的 Hallo2 相比,Hallo3 在生成动态场景和沉浸式背景方面有了显著提升,让肖像动画不再局限于简单的表情变化,而是能将角色也融入到场景中。
02:10
马克·扎克伯格批准Meta的Llama团队使用受版权保护的作品进行训练,并提交相关声明
Meta 因使用盗版数据集 LibGen 训练 Llama 大语言模型面临版权诉讼。诉讼文件显示,Meta CEO 扎克伯格批准使用该数据集,尽管公司内部对版权风险存在担忧。Meta 被指控通过删除版权信息掩盖侵权行为,并采用 torrent 技术获取数据。此案凸显了 AI 模型训练中数据来源合法性的关键挑战,以及大模型开发与版权保护的复杂平衡。