已选标签:
1月 9日
9 条新闻
09:14

Adobe 发布 TransPixar:生成透明背景视频的创新技术

TransPixar 是 Adobe 最新发布的一项创新技术,能够通过文本和图像生成透明背景的视频。

不仅支持创建烟雾和反射等透明元素,还提供了高度逼真的视觉效果。可以看看演示视频,效果相当不错。也可以在 Hugging Face 体验在线版本,不过在线版限制了帧率和推理步骤。代码是开源的,有兴趣的可以直接本地部署。

来源:三花快讯

09:14

NeuralSVG:文本生成可编辑矢量图形的创新工具

NeuralSVG:文本生成可编辑矢量图形的创新工具

NeuralSVG 是一款创新的工具,能够根据文本提示生成有序且可编辑的矢量图形。通过简化和分层 SVG 输出,NeuralSVG 解决了传统 SVG 生成结构过于复杂、难以二次编辑的问题。

官方展示的效果非常出色,生成的 SVG 文件不仅结构清晰,还支持分层编辑,极大地方便了设计师和开发者。目前,NeuralSVG 尚未开源,但我会持续跟进最新动态,第一时间为大家带来更新。关注我,不错过任何重要信息!

来源:三花快讯

06:10

哈莉戴的489美元智能眼镜将微型屏幕投射到你的眼前

哈莉戴的489美元智能眼镜将微型屏幕投射到你的眼前

Halliday 在 CES 2025 推出的智能眼镜通过 DigiWindow 技术,将 3.5 英寸圆形显示屏直接投射到用户视野中,支持实时语言翻译、手机通知显示及 AI 助手功能。该设备采用轻量化设计,无需昂贵 AR 镜片,支持处方镜片,定价 489 美元。其核心技术结合了多模态 AI 模型,支持 40 种语言的实时翻译,并计划集成主动式 AI 助手。尽管 DigiWindow 的定位仍需优化,但其轻便、低延迟的特点展示了智能眼镜在 AI 助手、多模态交互等领域的潜力,为未来可穿戴设备的 AI 应用提供了新方向。

来源:TechCrunch AI

05:33

Grok可能很快会推出“无拘模式”

xAI 推出的 Grok 聊天机器人即将推出 ‘Unhinged Mode’,旨在提供更具争议性和冒犯性的回答,突破传统 AI 的过滤限制。该模式反映了 Elon Musk 对 AI 的愿景,即打破 ‘政治正确’ 的束缚,提供更直接、未经过滤的对话体验。然而,Grok 目前仍受限于其训练数据(公开网页),导致其在政治敏感话题上表现出左倾倾向。Musk 承诺将调整模型以实现政治中立。这一发展凸显了 AI 在内容生成和伦理规范方面的挑战,特别是在平衡言论自由与社会责任之间的复杂关系。

来源:TechCrunch AI

02:05

本周人工智能:更强大的AI即将到来,但其益处能否均衡分布?

OpenAI CEO Sam Altman 宣布公司已掌握构建通用人工智能(AGI)的技术路径,并开始瞄准超级智能(Superintelligence)。AGI 被定义为在大多数经济价值工作中超越人类的自主系统,而超级智能则可能大幅加速创新。然而,近期研究表明,AI 对自由职业者的影响呈现“拐点效应”:初期提升收入,但后期可能取代工作岗位,如翻译领域收入下降 30%。此外,GPT-4 在金融领域的应用显示,AI 辅助可显著提升专家决策效率。随着 AI 能力提升,如何确保其收益广泛分配成为关键挑战。

来源:TechCrunch AI

01:05

实时更新 CES 2025:英伟达、人工智能、电动汽车发布及更多第二天动态

CES 2025 展示了 AI 技术的多样化应用与创新趋势。Nvidia CEO 强调其系统性能超越摩尔定律,通过全栈创新推动 AI 算力提升。Delta Air Lines 推出 AI 助手,优化用户体验并整合 Uber 服务。AI 在宠物科技领域也取得进展,如 Birdfy 的 AI 鸟类识别系统。此外,Waymo-Zeekr 合作的自动驾驶出租车亮相,突显 AI 在交通领域的突破。整体来看,AI 正加速渗透至消费、交通、娱乐等多个场景,推动产业智能化升级。

来源:TechCrunch AI

00:05

Omi,作为Friend的竞争对手,希望通过AI和“脑机接口”提升你的生产力

旧金山初创公司 Based Hardware 在 CES 2025 上推出 AI 可穿戴设备 Omi,旨在提升生产力。Omi 支持语音激活和脑机接口,通过 GPT-4o 实现对话总结、任务管理和个性化建议。设备采用开源平台,允许用户自定义数据存储和 AI 模型选择,开发者已创建 250+ 应用。Omi 定价 89 美元,预计 2025 年 Q2 发货,开发者版已开放订购。该设备探索了 AI 在可穿戴领域的创新应用,但脑机接口功能尚未完全验证。

来源:TechCrunch AI

00:00

Grove利用人工智能缩短临床试验招募时间

Grove AI 利用生成式 AI 技术,开发语音助手 Grace,显著优化临床试验患者招募流程。通过语音交互进行预筛选,Grace 将注册时间从数周缩短至几分钟,并自动安排现场访问。该技术解决了医疗领域长期存在的官僚主义和系统落后问题,已服务 70,000 名患者,完成 7,000 次预约。Grove AI 近期获得 490 万美元种子轮融资,投资者看好其在 AI 和计算生物学领域的潜力。此外,公司正开发基于 AI 的患者数据管理工具,有望进一步推动医疗数据管理的数字化转型。

来源:TechCrunch AI

1月 8日
1 条新闻
16:17

微软通过公共和私营部门的交易支持其在印度的30亿美元人工智能计划

微软宣布在印度核心领域展开广泛AI合作,计划投资30亿美元,与政府及企业合作推动AI技术应用。重点包括:支持印度AI数据集平台的数据收集与合成生成,培训50万名AI技术人才,建立AI卓越中心及20个AI实验室。合作涵盖铁路、医疗、金融、制造和教育领域,如与RailTel合作推进铁路数字化和AI转型,与Apollo Hospitals开发医疗AI助手,与Bajaj Finance合作实现年成本节约1800万美元。此举旨在与谷歌、亚马逊等竞争,加速AI在印度的商业落地和人才培养,推动多模态AI和边缘计算等技术的应用。

来源:TechCrunch AI

1月 6日
9 条新闻
11:31

罗永浩 Jarvis 发布 J1 Assistant:安卓用户的 AI 新助手

罗永浩 Jarvis 发布 J1 Assistant:安卓用户的 AI 新助手

罗永浩旗下的 AI 初创项目 Jarvis 近日发布了名为 J1 Assistant 的聚合类 AI 助理软件。目前,该软件仅支持部分安卓机型。用户可以通过长按发送语音至联系人、谷歌搜索引擎、ChatGPT 或创建备忘录。UI 设计颇具锤子科技风格,当前版本为 0.8.3-beta1。感兴趣的朋友可以在J1 Assistant 官网(https://matter.ai/)下载体验。

来源:三花快讯

11:26

阿里通义千问 Qwen 推 CodeElo 基准,OpenAI o1-mini 夺冠超 90% 人类程序员

阿里通义千问 Qwen 推出了 CodeElo 基准测试,利用 Elo 评级系统评估大语言模型(LLM)的编程能力。CodeElo 通过 CodeForces 平台的题目进行测试,确保评估的准确性和全面性。在测试中,OpenAI 的 o1-mini 模型表现最佳,Elo 评分为 1578,超过了 90% 的人类程序员。
来源:AI工具集

来源:AI工具集

11:26

「天工大模型4.0」o1版和4o版正式上线天工APP和网页,免费使用

昆仑万维集团宣布,「天工大模型4.0」o1版和4o版于2025年1月6日正式上线天工网页和APP,供用户免费使用。o1版专注于中文逻辑推理,具备强大的数学、代码、逻辑、常识和伦理决策能力,通过多智能体体系和强化学习等技术提升推理性能。4o版为多模态模型,语音对话助手Skyo具有情感表达和多语言切换能力,提供流畅的实时对话体验。
来源:昆仑万维集团

来源:AI工具集

10:35

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

SHMT自监督层级化妆迁移模型代码开源,NeurIPS2024官方认证!

由阿里巴巴达摩院实习生孙朝阳等人开发的SHMT模型,采用隐式扩散模型实现自监督层级化妆迁移,已被NeurIPS2024接收。项目包含训练、测试代码及预训练模型,已开源并验证可正常训练和推理。此外,团队在CVPR2024、TNNLS2023和AAAI2022也有相关成果发布。代码链接:https://github.com/Snowfallingplum/SHMT

来源:GitHub

08:56

萨姆·阿尔特曼对解雇他的OpenAI董事会成员有话要说

OpenAI CEO Sam Altman 在采访中透露了公司未来技术发展方向,包括芯片计划和大语言模型 ChatGPT 的定价策略。这一事件凸显了 AI 企业在技术研发与商业化落地中的关键挑战,如算力优化、成本控制和商业模式的探索。OpenAI 的技术路线将继续影响大语言模型和多模态 AI 的发展,推动其在智能助手、AI 编程等领域的应用深化。

来源:TechCrunch AI

1月 4日
1 条新闻
00:00

生成式人工智能投资在2024年达到新高

2024 年生成式 AI 投资创历史新高,全球融资达 560 亿美元,同比增长 192%。OpenAI、Anthropic、xAI 等头部企业持续获得大额融资并推出创新产品。美国公司占据主导地位,但中国、欧洲等地也有 Moonshot AI、Mistral 等企业获得显著投资。生成式 AI 在编程助手、媒体创作等垂直领域竞争加剧,但技术挑战和高计算成本可能限制中小企业的持续创新。基础设施层企业(如数据中心)受益显著,预计全球 AI 数据中心年支出将达 2500 亿美元。未来,行业可能面临估值泡沫和技术瓶颈的双重挑战。

来源:TechCrunch AI