1月
20日
2 条新闻
15:49
非洲金融科技独角兽 Moniepoint 的成功退出凸显了早期投资在金融科技领域的潜力。Oui Capital 通过其首支基金投资 Moniepoint,实现了 8 倍回报,并成功返还了 400 万美元的基金。这一案例展示了 AI 技术在金融科技中的应用价值,特别是在支付流程数字化和 B2B 平台优化方面。Moniepoint 的成长历程也反映了 AI 驱动型企业在非洲市场的快速发展,尽管该地区的退出机会仍相对稀缺。未来,随着 AI 技术的进一步成熟,金融科技领域的投资回报潜力有望继续扩大。
13:49
通义:一分钟生成互动2D卡通角色,Textoon引领新潮流
您的浏览器不支持视频播放。
2D卡通风格在数字角色创作中备受青睐,尤其受年轻观众欢迎。尽管3D技术发展迅速,但Live2D格式的2D卡通角色因其高效、轻量的特点,提供了模拟3D运动的动画效果,无需构建完整的3D模型。最新推出的Textoon方法,基于文本描述生成多样化的2D卡通角色,利用先进的语言和视觉模型,快速生成生动互动的角色,显著提升了创作效率与多样性。
1月
19日
1 条新闻
23:01
新论文发现人工智能在历史方面表现不佳
最新研究表明,尽管大语言模型(LLMs)在编程等任务中表现出色,但在高级历史考试中表现欠佳。研究团队使用 Hist-LLM 基准测试了 GPT-4、Llama 和 Gemini 等模型,发现 GPT-4 Turbo 的准确率仅为 46%。模型在处理复杂历史问题时,倾向于从显性数据中推断,难以检索到更隐晦的历史知识。此外,模型在特定地区(如撒哈拉以南非洲)的表现较差,暗示训练数据可能存在偏差。研究指出,LLMs 在历史研究领域仍需改进,但未来有望辅助历史学家,特别是在扩展数据覆盖和增加问题复杂性方面。
1月
17日
1 条新闻
06:32
尽管风投在第四季度投资了750亿美元,初创企业融资依然困难,数据证明这一点。
2023年第四季度,美国初创企业融资达746亿美元,其中432%集中于少数AI巨头:Databricks(100亿)、OpenAI(66亿)、xAI(60亿)、Waymo(56亿)和Anthropic(40亿)。这些巨额融资凸显了AI领域的两极分化趋势,资金高度集中于大语言模型、生成式AI和自动驾驶等前沿技术。尽管整体融资回暖,但大部分初创企业仍面临融资困境,表明AI产业生态正加速向头部企业集中。未来,VC投资可能继续聚焦于最具潜力的AI公司,推动基础模型、多模态融合和自动驾驶等技术的商业化落地。
1月
15日
5 条新闻
22:33
岩鱼正在帮助企业利用合成数据
Rockfish 是一家利用生成式 AI 创建合成数据的初创公司,旨在解决企业数据孤岛问题。其产品集成 AWS、Azure 等数据库,专注于金融交易、网络安全和供应链等操作数据的实时生成与优化。合成数据市场正快速增长,Rockfish 通过技术差异化(如持续数据摄入)和高质量团队(多位数据科学博士)脱颖而出。该公司已获 600 万美元融资,客户包括 Conviva 和美国军方。随着 AI 训练数据需求增长,合成数据领域竞争加剧,Tonic AI、Mostly AI 等公司也在积极布局。
09:00
Nvidia支持台湾初创公司MetAI,该公司专注于创建AI驱动的数字孪生
Nvidia 投资台湾初创公司 MetAI,推动 AI 驱动的数字孪生技术发展。MetAI 利用 AI 和 3D 技术,快速生成“SimReady”数字孪生,将 CAD 文件转化为功能化 3D 环境,加速物理 AI 训练和验证。其技术专注于半导体制造、智能仓储和自动化领域,通过生成合成数据优化 AI 模型训练。MetAI 的独特之处在于结合生成模型和 AI 驱动布局,创建适用于机器人等高级自动化系统的数字孪生,弥合仿真与现实的差距。Nvidia 的支持进一步推动了生成物理 AI 的发展,为工业 AI 应用提供更高效的解决方案。
05:47
任天堂Switch 2或于本周公布:截至目前的传闻与事实
Nintendo Switch 2 即将发布,预计将延续前代产品的成功,并可能引入 AI 技术提升游戏体验。尽管具体细节尚未公布,但业界猜测新主机可能在图形处理、多模态交互(如磁吸 Joy-Con)和屏幕尺寸上有所升级。AI 技术的潜在应用包括增强游戏中的智能 NPC 行为、优化图形渲染效率以及通过强化学习提升玩家体验。此外,向后兼容性确保了现有用户的平滑过渡,进一步巩固 Nintendo 在游戏市场的地位。
05:45
英特尔将其企业风险投资部门英特尔资本分拆为独立基金
Intel 宣布计划将其企业风投部门 Intel Capital 分拆为独立基金,以增强其投资灵活性和吸引外部资本的能力。Intel Capital 自 2014 年起加大了对 AI 初创企业的投资,包括 AI 芯片公司 SambaNova、AI21 Labs、人形机器人公司 Figure 和 AI 开发平台 Anyscale。此举旨在优化资产价值并提升业务效率,同时支持 AI 芯片、边缘计算和云计算等领域的创新。分拆预计于 2025 年下半年完成,标志着 Intel 在 AI 产业生态中的进一步布局。
02:05
为什么一些前Bench客户不满意
金融科技领域 AI 应用持续扩展:Moody’s 收购地理空间 AI 初创公司 Cape Analytics,强化其在风险评估中的 AI 能力;Open Ledger 推出嵌入式自动化会计软件,推动企业财务流程智能化。此外,Plaid 计划在 Raleigh 开设新办公室,以满足金融服务业对 AI 技术日益增长的需求。这些动态凸显了 AI 在金融科技中的关键作用,尤其是在自动化、数据分析和风险管理等领域的深度应用。
1月
13日
2 条新闻
09:47
Adobe FaceLift:单张照片生成高保真 3D 头部模型
FaceLift 是 Adobe 最新发布的一项技术,仅需一张人脸照片,就能快速生成高保真的 3D 头部模型。
该技术首先利用扩散模型从单张脸部照片生成侧面和背面的视图,然后通过 GS-LRM 重建器生成 3D 高斯样条表示,实现全头新视角的合成。
此外,FaceLift 还能处理视频输入,进行 4D 合成,并与 2D 动画技术结合,实现 3D 面部动画。
从官网的一些交互式案例来看,效果还不错,不过不能放大看,恐怖谷效应拉满了。目前这项技术还没有开源,关注我为你持续跟进。
09:47
阿里通义团队推出 Qwen Chat:支持全系列 Qwen 模型
Qwen Chat 是阿里通义团队近日上线的一款基于开源的 Open WebUI 的 WebUI,支持 Qwen 全系列模型。
模型包括 Qwen2.5-Plus 对话模型、QwQ 和 QVQ 等推理模型,以及 Qwen2.5-Coder-32B-Instruct 编程模型。
Qwen Chat 支持同时对比多个模型,还即将推出网络搜索、图像生成和语音模式,值得期待。
1月
11日
1 条新闻
23:00
英伟达的AI帝国:聚焦其顶级初创投资
Nvidia 在生成式 AI 浪潮中迅速崛起,成为 AI 生态系统的关键推动者。自 ChatGPT 发布以来,其营收和股价大幅增长,并显著加大了对 AI 初创企业的投资。2024 年,Nvidia 参与了 49 轮 AI 公司融资,远超过去四年总和。其投资重点包括 OpenAI、xAI、Inflection 等生成式 AI 领军企业,以及自动驾驶、数据标注等领域的创新公司。Nvidia 通过战略投资扩展 AI 生态系统,推动大模型、自动驾驶、AI 基础设施等技术的商业化落地,展现了其在 AI 产业链中的核心地位。
1月
10日
2 条新闻
09:54
百度与复旦大学联合开源 Hello3:革命性数字人头动画技术
Hello3 是复旦大学和百度联合开源的数字人头(肖像动画)技术,能让静态肖像在各种场景下动起来,而且动作自然、画面逼真。它不仅能处理正面肖像,还能应对各种角度和姿态,甚至能让肖像与周围物体互动。
与之前的 Hallo2 相比,Hallo3 在生成动态场景和沉浸式背景方面有了显著提升,让肖像动画不再局限于简单的表情变化,而是能将角色也融入到场景中。
00:03
谷歌的“每日聆听”AI功能根据您的Discover信息流生成播客
Google 正在测试基于 AI 的“Daily Listen”功能,通过用户 Discover 订阅内容自动生成个性化播客。该功能利用大语言模型和多模态技术,将用户兴趣转化为 5 分钟音频摘要,并附带相关故事链接。Daily Listen 与 NotebookLM 的 Audio Overviews 类似,均通过 AI 虚拟主持人生成内容,展现了 AI 在个性化内容生成领域的创新应用。该功能目前面向美国用户开放,标志着 AI 在音频内容创作和个性化推荐领域的进一步落地。
1月
9日
4 条新闻
15:25
xAI 正在测试其Grok聊天机器人的独立iOS应用
Elon Musk 的 AI 公司 xAI 推出独立 iOS 应用 Grok,扩展其多模态生成式 AI 能力。Grok 支持实时数据访问、文本重写、段落摘要、问答及文本生成图像等功能,尤其在图像生成领域表现出色,支持逼真渲染且限制较少。xAI 计划通过 Grok.com 提供网页版访问,进一步推动 AI 助手在智能交互与内容创作领域的应用。此举标志着生成式 AI 在跨平台部署与商业化落地上的重要进展。
09:14
SAI 开源 SPAR3D:一秒内从单图生成可编辑 3D 模型
SPAR3D 是 SAI 最近开源的一项图生 3D 技术,能够在短短一秒内从单张图片生成可编辑的 3D 模型。这项技术对于商业和非商业用途均免费开放,只要年收入小于 100 万美元即可使用。目前,代码和模型都已经公开发布。
09:14
NeuralSVG:文本生成可编辑矢量图形的创新工具
NeuralSVG 是一款创新的工具,能够根据文本提示生成有序且可编辑的矢量图形。通过简化和分层 SVG 输出,NeuralSVG 解决了传统 SVG 生成结构过于复杂、难以二次编辑的问题。
官方展示的效果非常出色,生成的 SVG 文件不仅结构清晰,还支持分层编辑,极大地方便了设计师和开发者。目前,NeuralSVG 尚未开源,但我会持续跟进最新动态,第一时间为大家带来更新。关注我,不错过任何重要信息!
09:14
Adobe 发布 TransPixar:生成透明背景视频的创新技术
TransPixar 是 Adobe 最新发布的一项创新技术,能够通过文本和图像生成透明背景的视频。
不仅支持创建烟雾和反射等透明元素,还提供了高度逼真的视觉效果。可以看看演示视频,效果相当不错。也可以在 Hugging Face 体验在线版本,不过在线版限制了帧率和推理步骤。代码是开源的,有兴趣的可以直接本地部署。
1月
6日
2 条新闻
10:35
SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!
由阿里巴巴达摩院实习生孙朝阳等人开发的SHMT模型,采用隐式扩散模型实现自监督层级化妆迁移,已被NeurIPS2024接收。项目包含训练、测试代码及预训练模型,已开源并验证可正常训练和推理。此外,团队在CVPR2024、TNNLS2023和AAAI2022也有相关成果发布。代码链接:https://github.com/Snowfallingplum/SHMT
00:00
TangoFlux:极速文本转音频生成模型
TangoFlux 是一个开源的极速文本转音频(TTA)生成模型,在单个 A40 GPU 上仅需 3.7 秒即可生成 30 秒的 44.1kHz 音频。佬友们可以在线体验 看看,速度确实飞快,生成的质量也算还行。