AI新闻 | 第4页 | goodux 好体验

标签筛选

已选标签:

1月 2日

6 条新闻

18:05

阿里云与零一万物达成战略合作，成立“产业大模型联合实验室”

阿里云与零一万物达成战略合作，共建“产业大模型联合实验室”，旨在加速大模型技术应用落地和产业生态整合。双方将结合研发实力，通过阿里云百炼大模型平台提供服务。进一步深化双方在AI大模型领域的合作。
来源：IT之家

来源：AI工具集

18:05

智象未来多模态大模型3.0全球首发

智象未来发布智象多模态生成大模型3.0和智象多模态理解大模型1.0，旨在提升视觉多模态基础模型服务，激发创造力。创始人梅涛院士强调了AI技术在推动科学发展和具身智能方面的重要性，提出了大模型通往AGI的两条路径。
来源：HiDream智象未来

来源：AI工具集

00:00

创新插件VMix：大幅提升生成图像的美学质量

创新插件VMix：大幅提升生成图像的美学质量

字节跳动与中科大团队推出VMix，通过新颖的价值混合交叉注意力机制，显著提升扩散模型生成图像的美学质量。VMix能系统性增强图像的颜色、光线和构图等细节维度，弥合生成图像与现实美学之间的差距。该插件无需重新训练即可应用于社区模型，实验表明其效果优于现有方法，并兼容LoRA、ControlNet等模块。VMix通过分离文本提示中的内容描述和美学描述，优化去噪过程，从而在保持图像与文本对齐的同时，大幅提高视觉表现。

来源：字节跳动 & 中科大

00:00

字节发布 VMix：提升扩散模型生图美学质量

字节发布 VMix：提升扩散模型生图美学质量

VMix 是字节发布的一项提升扩散模型生图美学的技术。它能够在颜色、光照、构图等细粒度维度上更精准地遵循提示词，同时还能兼容原有的 LoRA、ControlNet 和 IPAdapter。图片里演示的是对 SDXL 模型的增强，不过，VMix 现在还没有开源，关注我为你持续跟进。

来源：三花快讯

00:00

百度推出全新AI搜索引擎“AI搜”，整合多内容生态，提供无广告权威结果

百度推出全新AI搜索引擎“AI搜”，整合多内容生态，提供无广告权威结果

百度近期在Web端首页推出全新的搜索引擎入口“AI搜”（Chat.baidu.com），基于文心大模型，整合了百度搜索、健康、律临、文库、教育等多内容生态，提供无广告、可靠和权威的搜索结果。功能涵盖话题探索、问题解决、决策辅助等，支持文生图、逻辑推理、智能摘要等AI技术。用户还可创建智能体并互动，提升个性化体验。李彦宏宣布2025年初将推出文心大模型新版本，持续加强AI技术应用。

来源：AI Base

00:00

一年800亿，字节凶猛，追赶AI

一年800亿，字节凶猛，追赶AI

字节跳动在大模型领域起步较晚，但凭借强大的资源投入和战略布局，迅速崛起。2024年，豆包App月活跃用户达5998万，跃居全球第二、国内第一。字节通过C端高强度市场投放、B端低价策略及持续的算力和人才投入，在短短一年多内实现了从“迟到者”到“破局者”的转变。此外，字节正构建全面的AI产品生态体系，涵盖大模型产品、基础AI开发、AI社交等多领域，目标是再造一个“AI工厂”。

来源：TechWeb

1月 1日

2 条新闻

00:00

威尔·史密斯吃意大利面及其他在2024年走红的奇特AI基准测试

2024年，AI视频生成技术取得显著进展，Google Veo 2等模型成功实现逼真的Will Smith吃意大利面视频生成，成为社区热门基准。此外，AI在游戏设计（如Minecraft）和互动游戏（如Pictionary）中的应用也引发关注。尽管学术界存在更严谨的AI性能测试，但这些非正式基准因其娱乐性和易理解性而广受欢迎。专家指出，AI社区应更关注AI的实际下游影响，而非局限于狭窄领域的性能测试。未来，随着AI技术的复杂性和应用场景的扩展，如何将其转化为易于理解的营销信息仍是行业挑战。

来源：TechCrunch AI

00:00

蓝色起源即将凭借新格伦发射挑战SpaceX的主导地位

Blue Origin 即将首次发射其轨道火箭 New Glenn，标志着其正式进入由 SpaceX 主导的发射行业。New Glenn 配备了七台 BE-4 发动机，可产生超过 380 万磅的推力，并计划通过垂直着陆实现助推器的重复使用。此次发射将搭载 Blue Ring 航天器的演示技术，该航天器旨在提供轨道运输、物流和卫星服务。Blue Origin 的发射计划涉及 NASA、Space Force 和亚马逊的 Project Kuiper 等多个合作伙伴。这一进展展示了 AI 在航天领域的应用潜力，特别是在轨道计算、任务规划和自动化操作中的关键作用。

来源：TechCrunch AI

12月 31日

11 条新闻

00:00

从AI代理到企业预算，20位风险投资家分享他们对2025年企业技术的预测

2025年企业AI应用展望：尽管AI被视为工业革命以来最大的技术突破，企业采用速度仍较慢。专家预测，随着高质量数据需求的增加，AI将从实验阶段转向大规模部署。重点关注领域包括：AI代码代理用于应用现代化、高成本行业自动化（如会计和法律服务）、以及企业销售周期和定价模型的变化。投资趋势聚焦于企业韧性、数据主权服务和任务特定模型。技术发展将探索替代Transformer的解决方案，以减少LLM训练和生产的计算需求。企业技术价值将从单纯驱动收入或降低成本，转向同时减少业务摩擦。

来源：TechCrunch AI

00:00

全国首家人工智能艺术学院在天津成立，2025年开始招研究生

12月30日，天津美术学院成立全国首个专门的人工智能艺术学院，旨在探索AI与艺术的深度融合。该学院将开设数据艺术、生成艺术等4个研究生方向，2025年9月开始招生，计划招收20余人。学院还将优化通识课程，助力天津文旅发展，并与多家单位合作，推动产教融合，培养具有国际视野和创新思维的艺术人才。

来源：天津日报

00:00

字节跳动似乎在规避美国限制购买英伟达芯片

字节跳动计划在2025年斥资70亿美元购买英伟达芯片，以支持其AI业务发展，包括其热门AI聊天机器人“豆包”。尽管美国对中国实施AI芯片出口限制，字节跳动通过将芯片存储于东南亚数据中心规避了直接限制。此举凸显了全球AI竞赛中算力的重要性，以及企业在应对政策限制时的创新策略。字节跳动的投资将加速其在生成式AI、大语言模型等领域的研发，进一步推动AI技术在智能助手等应用场景的落地。

来源：TechCrunch AI

00:00

华佗 GPT-o1：专为医学推理设计的开源 LLM

华佗 GPT-o1：专为医学推理设计的开源 LLM

华佗 GPT-o1 是香港中文大学深圳分校推出的专为医学推理设计的医学 LLM。基于 Qwen2.5 的版本支持中英文双语，并且完全开源，包括数据集。当然，如果你更喜欢纯英文模型，也有基于 LLaMA-3.1 的版本，可以使用 vllm 或 Sglang 等工具进行部署。

来源：三花快讯

00:00

Switti：生成速度超快的文本生成图像模型

Switti 是一个生成速度超快的文本生成图像模型，其性能优于现有的自回归模型，媲美现有的扩散模型，同时生成速度最高快7倍。

Switti 的论文早在5月份就已发布，近日，其模型终于开源，能够生成1024*1024的图片，速度超级快。你可以在在线演示中亲自感受其超快的生成速度。

来源：三花快讯

00:00

稚晖君又开源！全球首个大规模真实场景机器人数据集AgiBot World发布

稚晖君又开源！全球首个大规模真实场景机器人数据集AgiBot World发布

稚晖君在3个月内第三次开源，推出全球首个基于全域真实场景、全能硬件平台的机器人数据集AgiBot World。该项目由智元机器人联合上海AI Lab等机构发布，涵盖80余种日常生活技能，数据规模比现有数据集高出10倍，场景覆盖面扩大100倍，质量达到工业级标准。数据集包含家居、餐饮、工业等多个核心场景，支持机器人完成复杂任务如插内存条、整理洗碗机和双臂协作搬运等。GitHub和抱抱脸已开放下载。

来源：量子位

00:00

AnimateDiff 到 Runway：AI 视频生成技术的飞跃

大佬 @GerdeGotIt 最近展示了一个对比：两年前使用 AnimateDiff 技术制作的 AI 视频与如今使用 Runway 制作的效果。可以看到 AI 视频生成技术的进步。特别是在画面的一致性和稳定性方面，提升不是一点半点！

来源：三花快讯

00:00

智谱正式发布深度推理模型：GLM-Zero 的初代版本 GLM-Zero-Preview

智谱AI在2024年尾发布 GLM-Zero 推理模型，初代版本GLM-Zero-Preview已上线，基于扩展强化学习技术，提升数理逻辑、代码处理和深度推理能力。模型在AIME 2024、MATH500和LiveCodeBench评测中表现优异，与OpenAI-o1-Preview相当。用户可在智谱清言-“Zero推理模型”智能体免费使用，开发者可通过API调用体验。
来源：AI工具集

来源：AI工具集

00:00

大模型的2024年：我们对AI的发展脱敏了

2024年AI领域发展迅速，大模型更实用但不再惊艳，端侧模型和混合专家技术（MoE）降低成本，多模态研究成新方向。AI搜索、语音交互、视频技术商业化挑战中前行，AI Agent开发门槛降低。AI硬件百花齐放，AI眼镜异军突起。AI游戏从辅助工具成为游戏一部分。中国AI人才梯队规模质量仅次于美国，期待在AI浪潮中领先。
来源：新硅NewGeek

来源：AI工具集

00:00

黑芝麻智能发布华山A2000家族芯片平台，打造全场景通识智驾标杆

黑芝麻智能发布华山A2000家族芯片平台，针对下一代AI模型设计，提供高算力、高性能，支持全场景通识智驾。A2000家族包括A2000 Lite、A2000和A2000 Pro，满足不同自动驾驶需求。集成领先CPU、DSP、GPU等，算力是主流旗舰芯片的4倍，原生支持Transformer模型，推动智能驾驶技术发展。
来源：黑芝麻智能

来源：AI工具集

00:00

OpenAI公布2025年将发布的技术产品：AGI、Agents、GPT-4o升级版

OpenAI首席执行官Sam Altman宣布，到2025年将发布包括AGI（通用人工智能）、智能体Agents、GPT-4o升级版在内的多项技术产品，以及其他改进，如更好的记忆存储、上下文窗口、成人模式、深度研究特色功能、Sora和个性化定制。
来源：第一财经

来源：AI工具集

12月 30日

1 条新闻

00:00

Aria-UI：领先的 GUI 多模态模型，AndroidWorld 基准测试第一

Aria-UI 是一个专为 GUI 基础设计的大型多模态模型，类似于 Claude Computer use。它无需 HTML 或 AXTree 输入，采用纯视觉方法。作为 Moe 模型其速度也非常快。

在 AndroidWorld 基准测试中以 44.8% 的成功率排名第一。

官方提供了一个在线演示，确实速度挺快的，不过该技术是底层模型，没有封装成可交互的应用。

来源：三花快讯