AI News / 中文同步

AI News 中文同步版

自动同步自 smol-ai/ainews-web-2025，由 AI 并行翻译。

最近更新：2026-04-02 共 621 篇

说明

每日自动同步与翻译，保留原文结构，方便检索与阅读。

今天没发生什么事。 2026-03-30
今天没发生什么事。 2026-03-27
今天没发生什么特别的事。 2026-03-24
今天没发生什么特别的事。 2026-03-24
今天没发生什么特别的事。 2026-03-24
今天没发生什么事。 2026-03-24
今天没发生什么特别的事。 2026-03-23
今天没什么事。 2026-03-20
今天没发生什么特别的事。 2026-03-19
MiniMax 2.7：以 1/3 的成本实现 GLM-5 级性能，SOTA 级开源模型。 2026-03-18
今天没发生什么事。 2026-03-16
今天没发生什么特别的事。 2026-03-16
今天没发生什么特别的事。 2026-03-12
今天没什么事。 2026-03-11
今天没发生什么特别的事。 2026-03-10
Yann LeCun 的 AMI Labs 获 10.3 亿美元种子轮融资成立，旨在围绕 JEPA 构建世界模型。 2026-03-10
自动化研究：递归式自我提升的火花 2026-03-09
今天没发生什么特别的事。 2026-03-06
GPT 5.4 2026-03-05
今天也没什么大事。 2026-03-04
今天没什么事。 2026-03-03
今天没发生什么特别的事。 2026-03-02
OpenAI 完成了来自亚马逊、英伟达（NVIDIA）和软银（SoftBank）的 1100 亿美元融资，这是历史上规模最大的初创公司融资，投后估值达到 8400 亿美元。 2026-02-27
OpenAI 完成了来自亚马逊、英伟达（NVIDIA）和软银（SoftBank）的 1100 亿美元融资，这是历史上规模最大的初创公司融资，投后估值达到 8400 亿美元。 2026-02-27
Nano Banana 2（即 Gemini 3.1 Flash Image Preview）：新的 SOTA 图像生成模型 2026-02-26
Gemini Nano 香蕉 2 2026-02-26
Nano Banana 2（即 Gemini 3.1 Flash Image Preview）：新的 SOTA 图像生成模型 2026-02-26
智能体工程：2025年12月到底发生了什么？ 2026-02-25
智能体工程：2025年12月到底发生了什么？ 2026-02-25
Claude Code 周年庆 + 新品发布：Qwen 3.5、Cursor 演示、Cognition Devin 2.2、Inception Mercury 2。 2026-02-24
Anthropic 指控 DeepSeek、月之暗面（Moonshot AI）和 MiniMax 进行了“工业规模的蒸馏攻击”。 2026-02-24
Claude Code 周年庆 + 新品发布：Qwen 3.5、Cursor 演示、Cognition Devin 2.2、Inception Mercury 2。 2026-02-24
Anthropic 指控 DeepSeek（深度求索）、Moonshot（月之暗面）和 MiniMax 进行了“工业级规模的蒸馏攻击”。 2026-02-24
Anthropic 指控 DeepSeek、月之暗面（Moonshot AI）和 MiniMax 进行了“工业规模的蒸馏攻击”。 2026-02-24
今天没发生什么事。 2026-02-21
今天没发生什么事。 2026-02-21
Gemini 3.1 Pro：在 ARC-AGI 2 测试中表现达到 3.0 的两倍。 2026-02-19
Gemini 3.1 Pro：在 ARC-AGI 2 测试中表现达到 3.0 的两倍。 2026-02-19
今天没发生什么特别的事。 2026-02-18
今天没发生什么特别的事。 2026-02-18
Claude Sonnet 4.6：4.5 版本的利落升级，整体表现更佳，但仍有一些注意事项。 2026-02-17
Claude Sonnet 4.6：4.5 版本的利落升级，整体表现更佳，但仍有一些注意事项。 2026-02-17
Qwen3.5-397B-A17B：Open-Opus 级别中最小且非常高效的模型。 2026-02-16
Qwen3.5-397B-A17B：Open-Opus 级别中最小且非常高效的模型。 2026-02-16
Qwen3.5-397B-A17B：Open-Opus 系列中最小的级别，是一款非常高效的模型。 2026-02-16
MiniMax-M2.5：顶尖（SOTA）级编程、搜索、工具调用能力，仅需 $1/小时。 2026-02-13
MiniMax-M2.5：顶尖（SOTA）级编程、搜索、工具调用能力，仅需 $1/小时。 2026-02-13
新款 Gemini 3 Deep Think（深度思考版），Anthropic 以 3800 亿美元估值融资 300 亿美元，GPT-5.3-Codex Spark，MiniMax M2.5。 2026-02-12
新款 Gemini 3 Deep Think（深度思考版），Anthropic 以 3800 亿美元估值融资 300 亿美元，GPT-5.3-Codex Spark，MiniMax M2.5。 2026-02-12
Z.ai GLM-5：全新 SOTA 开源权重型大语言模型 2026-02-11
Z.ai GLM-5：全新 SOTA 开源权重型大语言模型 2026-02-11
Qwen-Image 2.0 和 Seedance 2.0 2026-02-10
Qwen-Image 2.0 和 Seedance 2.0 2026-02-10
今天没发生什么特别的事。 2026-02-09
今天没发生什么特别的事。 2026-02-09
今天没什么事。 2026-02-06
OpenAI 与 Anthropic 开战：Claude Opus 4.6 对阵 GPT 5.3 Codex 2026-02-05
ElevenLabs 以 110 亿美元估值完成 5 亿美元 D 轮融资；Cerebras 以 230 亿美元估值完成 10 亿美元 H 轮融资；从 Vibe Coding（氛围编码）转向 Agentic Engineering（智能… 2026-02-04
上下文图谱：是噱头还是真正的万亿美元机遇？ 2026-02-03
OpenAI Codex 应用：VSCode 分支的终结、多任务工作树、技能自动化。 2026-02-02
MoltBook 占领了时间线。 2026-01-30
xAI Grok Imagine API —— 排名第一的视频模型，拥有最优的价格与延迟表现 —— 并且正在与 SpaceX 合并。 2026-01-29
今天没什么事。 2026-01-28
Moonshot Kimi K2.5 —— 性能超越 Sonnet 4.5 且成本仅需一半；全球领先（SOTA）开源模型；首款原生图像+视频模型；支持 100 路并行智能体集群（Agent Swarm）管理。 2026-01-27
Anthropic 在 Claude.ai 中发布 MCP Apps 开放规范。 2026-01-26
今天没发生什么特别的事。 2026-01-22
OpenEvidence（被称为“医生版 ChatGPT”）以 120 亿美元的估值融资 2.5 亿美元，较去年 2 月 10 亿美元的估值增长了 12 倍。 2026-01-21
今天没发生什么特别的事。 2026-01-20
今天没发生什么特别的事。 2026-01-19
ChatGPT 开始在免费版中测试广告，并在美国推出每月 8 美元的全新 Go 订阅计划。 2026-01-16
Open Responses：OpenAI 响应 API 的明确规范，支持 OpenRouter、Ollama、Huggingface、vLLM 等平台。 2026-01-15
今天没发生什么特别的事。 2026-01-15
Anthropic Labs：Cowork、Claude Code、MCP，以及由 Mike Krieger 和 Ben Mann 领导的技能孵化器。 2026-01-13
Anthropic 实验室：Cowork、Claude Code、MCP，以及由 Mike Krieger 和 Ben Mann 领导的技能孵化器。 2026-01-13
苹果公司选择谷歌的 Gemini 为下一代 Siri 提供支持。 2026-01-12
今天没发生什么特别的事。 2026-01-09
今天没发生什么事。 2026-01-08
今天没发生什么特别的事。 2026-01-07
xAI 完成 200 亿美元 E 轮融资，估值约为 2300 亿美元。 2026-01-06
今天没发生什么特别的事。 2026-01-05
今天没发生什么特别的事。 2026-01-02
今天没发生什么特别的事。 2025-12-31
今天没发生什么特别的事。 2025-12-30
“Meta Superintelligence Labs 以约 40 亿美元收购 Manus AI；此时距离该产品发布仅 9 个月，其年度经常性收入（ARR）已达 1 亿美元。” 2025-12-29
今天没发生什么事。 2025-12-26
英伟达以 200 亿美元现金收购 Groq（大部分业务）；系史上规模最大的“高管雇佣式收购”（execuhire）。 2025-12-24
今天没发生什么事。 2025-12-23
今天没发生什么事。 2025-12-22
今天没发生什么特别的事。 2025-12-19
Claude Skills 持续扩展：开放标准、目录与组织管理。 2025-12-18
Gemini 3.0 Flash 预览版：成本仅为 Pro 版的 1/4，但智能程度几乎旗鼓相当，重夺帕累托前沿（Pareto Frontier）。 2025-12-17
OpenAI GPT Image-1.5 号称超越了在各大竞技场（Arenas）排名第一的 Nano Banana Pro，但在“氛围感测试”（Vibe Checks）中却彻底翻车。 2025-12-16
NVIDIA Nemotron 3：参数量从 30B 到 500B 的完全开源混合 Mamba-Transformer 模型。 2025-12-15
今天没发生什么特别的事。 2025-12-12
GPT-5.2 (即时/思考/专业版)：GDPVal 评分为 74%，成本是 GPT 5.1 的 1.4 倍，发布于 OpenAI 成立 10 周年之际。 2025-12-11
今天没发生什么事。 2025-12-10
MCP -> 智能体 AI 基础，Mistral Devstral 2 2025-12-09
今天没发生什么事。 2025-12-08
今天没什么事。 2025-12-05
OpenRouter 人工智能现状报告：一项基于 100 万亿 Token 的实证研究 2025-12-04
今天没发生什么特别的事。 2025-12-03
Mistral 3：Mistral Large 3 + Ministral 3B/8B/14B 开放权重模型 2025-12-02
DeepSeek V3.2 与 3.2-Speciale：GPT-5 级别高性能开源权重、上下文管理及算力扩展计划 2025-12-02
今天没发生什么事。 2025-11-26
Black Forest Labs FLUX.2 (pro / flex / dev / klein)：接近 Nano Banana 的质量，但采用开放权重。 2025-11-25
Claude Opus 4.5：过去一周内发布的第三款 SOTA（最先进）级编程模型，价格仅为 Opus 的 1/3。 2025-11-24
AI 工程师代码峰会 2025-11-21
Nano Banana Pro (Gemini Image Pro) 解决了图像内文字生成、信息图表生成、2K-4K 分辨率以及 Google 搜索溯源（Grounding）等问题。 2025-11-20
OpenAI 反击：GPT-5.1-Codex-Max (API) 和 GPT 5.1 Pro (ChatGPT) 2025-11-19
Gemini 3 Pro —— 谷歌 DeepMind (GDM) 新一代前沿模型 6、Gemini 3 Deep Think 以及 Antigravity IDE。 2025-11-18
xAI Grok 4.1：Text Arena 排名第一、EQ-bench 排名第一，并拥有更出色的创意写作能力。 2025-11-17
今天没发生什么特别的事。 2025-11-14
GPT 5.1 和 SIMA 2 的小幅更新。 2025-11-13
ChatGPT 中的 GPT 5.1：暂无评测数据，但具备自适应思维与指令遵循能力。 2025-11-12
今天没发生什么特别的事。 2025-11-11
今天没发生什么特别的事。 2025-11-10
Terminal-Bench 2.0 与 Harbor 2025-11-07
Kimi K2 Thinking：1万亿总参数/320亿激活参数，在 HLE、BrowseComp、TauBench 评测中达到 SOTA（业界领先）水平；同时，Soumith 宣布离开 PyTorch。 2025-11-06
今天没发生什么事。 2025-11-05
今天没发生什么特别的事。 2025-11-04
今天没发生什么事。 2025-11-03
今天没发生什么特别的事。 2025-10-31
今天没发生什么事。 2025-10-30
Cursor 2.0 与 Composer-1：快速模型与全新智能体 UI 2025-10-29
OpenAI 完成与微软的合作及营利性重组 + 发布 2028 年 AI 研究员时间线 + 平台/AI 云产品方向 + 下一个 1 万亿美元算力投入。 2025-10-28
MiniMax M2 230BA10B —— 价格仅为 Claude Sonnet 的 8%，速度快约 2 倍，全新的 SOTA 开源模型。 2025-10-27
今天没发生什么事。 2025-10-24
今天没发生什么特别的事。 2025-10-23
今天没发生什么特别的事。 2025-10-22
ChatGPT Atlas：OpenAI 的 AI 浏览器 2025-10-21
DeepSeek-OCR 发现，视觉模型的解码效率可提升 10 倍，准确率达到纯文本水平的约 97%，单张 A100 显卡每天可处理 20 万页（33/200k pages/day/A100）。 2025-10-20
Karpathy 与 Dwarkesh 的这场访谈推迟了 AGI（通用人工智能）的时间表。 2025-10-17
Claude Agent Skills —— 是美化版的 AGENTS.md，还是 MCP 杀手？ 2025-10-16
Claude Haiku 4.5 2025-10-15
今天没发生什么事。 2025-10-14
OpenAI Titan XPU：与博通（Broadcom）合作的 10GW 规模自研芯片。 2025-10-13
今天没发生什么事。 2025-10-10
Air Street《2025 年人工智能现状报告》 2025-10-09
今天没发生什么事。 2025-10-08
Gemini 2.5 Computer Use 预览版击败了 Sonnet 4.5 和 OAI CUA。 2025-10-07
OpenAI 开发者大会：Apps SDK、AgentKit、Codex 正式版 (GA)、GPT-5 Pro 以及 Sora 2 API。 2025-10-06
今天没什么事。 2025-10-03
今天没发生什么事。 2025-10-02
Thinking Machines 的 Tinker：基于 LoRA 的大语言模型（LLM）微调 API。 2025-10-01
Sora 2：全新的视频+音频模型，以及 OpenAI 的首个社交网络。 2025-09-30
Anthropic Claude Sonnet 4.5、Claude Code 2.0 以及全新的 VS Code 扩展。 2025-09-29
今天没发生什么特别的事。 2025-09-26
GDPVal 研究发现：Claude Opus 4.1 已达到 AGI（通用人工智能）水平的 95%（以 44 种主要白领职业的人类专家为基准）。 2025-09-25
今天没什么事。 2025-09-24
阿里巴巴云栖大会：4天内发布7款模型（包括 Qwen3-Max、Qwen3-Omni、Qwen3-VL）及520亿美元发展路线图。 2025-09-23
英伟达（NVIDIA）将向 OpenAI 投资 1000 亿美元，用于部署 10GW 的 Vera Rubin 架构。 2025-09-22
Grok 4 Fast：xAI 的蒸馏版前沿模型，Token 效率提升 40%，具备 200 万上下文窗口，速度达 344 tok/s。 2025-09-19
软银、英伟达（NVIDIA）和美国政府将分别持有英特尔（Intel）2%、5% 和 10% 的股份，并计划为消费者和数据中心市场开发英特尔 x86 RTX 系统级芯片（SOC）。 2025-09-18
今天没发生什么。 2025-09-17
今天没什么事。 2025-09-16
GPT-5 Codex 的发布与 OpenAI 在智能体编程（Agentic Coding）领域的悄然崛起。 2025-09-15
今天没发生什么特别的事。 2025-09-13
Qwen3-Next-80B-A3B-Base：迈向极致的训练与推理效率 2025-09-11
甲骨文（Oracle）在赢得3000亿美元的OpenAI合同后，股价单日暴涨36%。 2025-09-10
今天没什么事。 2025-09-09
Cognition 获 100 亿美元 C 轮融资；Smol AI 更新动态。 2025-09-08
Kimi K2-0905 与 Qwen3-Max 预览版：两款万亿参数（1T）开放权重模型正式发布。 2025-09-05
今天没发生什么特别的事。 2025-09-04
今天没发生什么特别的事。 2025-09-03
Anthropic 以 1830 亿美元的估值完成 130 亿美元的 F 轮融资。 2025-09-02
今天没发生什么特别的事。 2025-09-01
今天没发生什么事。 2025-08-29
OpenAI Realtime API 正式发布，并推出全新 gpt-realtime 模型，价格比 GPT-4o 便宜 20%。 2025-08-28
OpenAI 更新了 Codex，其 VSCode 扩展现可将任务与 Codex Cloud 进行同步。 2025-08-27
nano-banana 即 Gemini-2.5-Flash-Image，其 Elo 评分领先 Flux Kontext 170 分，在一致性、编辑能力和多图融合方面达到了业界领先水平（SOTA）。 2025-08-26
今天没发生什么事。 2025-08-25
今天没发生什么特别的事。 2025-08-22
Cohere Command A Reasoning 击败了 GPT-OSS-120B 和 DeepSeek R1 0528。 2025-08-21
DeepSeek V3.1：经过 8400 亿 token 持续预训练，以 11% 的成本击败了 Claude 4 Sonnet。 2025-08-20
Databricks 的 1000 亿美元 K 轮融资 2025-08-19
今天没发生什么特别的事。 2025-08-18
今天没发生什么事。 2025-08-15
西方开源模型公司获融资：Cohere 以 68 亿美元估值融资 5 亿美元，AI2 获 NSF（美国国家科学基金会）与英伟达 1.52 亿美元资助。 2025-08-14
今天没发生什么特别的事。 2025-08-13
今天没发生什么事。 2025-08-12
OpenAI 的 IMO 金牌模型也摘得了 IOI（国际信息学奥林匹克竞赛）金牌。 2025-08-11
今天没发生什么事。 2025-08-08
OpenAI 向全球超过 10 亿用户推出 GPT-5 和 GPT-5 Thinking；-mini 与 -nano 版本助力其占据帕累托前沿（Pareto Frontier）。 2025-08-07
今天没什么特别的事。 2025-08-06
OpenAI 的 gpt-oss 20B 和 120B，Claude Opus 4.1，以及 DeepMind 的 Genie 3。 2025-08-05
Qwen-Image：SOTA 级文本渲染 + 4o 级图像生成编辑能力，开源权重 MMDiT。 2025-08-04
Gemini 2.5 Deep Think 终于发布了。 2025-08-01
Figma 估值超过 500 亿美元的 IPO（首次公开募股） 2025-07-31
今天没发生什么事。 2025-07-30
今天没发生什么特别的事。 2025-07-29
GLM-4.5：比 Kimi/Qwen/DeepSeek 更深邃、更硬核、更出色（中国最先进的大模型？） 2025-07-28
今天没发生什么特别的事。 2025-07-25
个月内增长3倍：Cursor 估值达 280 亿美元，Cognition + Windsurf 估值达 100 亿美元。 2025-07-24
今天没发生什么事。 2025-07-23
今天没发生什么事。 2025-07-22
OpenAI (OAI) 和 Google DeepMind (GDM) 宣布，在人类规定的时限内，无需专门的训练或工具，仅通过自然语言推理便取得了国际数学奥林匹克（IMO）金牌水平的成绩。 2025-07-21
ChatGPT 智能体：全新 o* 模型 + 统一的深度研究浏览器 + Operator 计算机操作功能 + 代码解释器终端 2025-07-17
今天没什么事。 2025-07-16
Voxtral —— Mistral 推出的 SOTA（顶尖水平）语音识别（ASR）模型，包含 3B（mini）和 24B（”small”）两种尺寸，其表现超越了 OpenAI 的 Whisper large-v3。 2025-07-15
今天没发生什么事。 2025-07-14
Kimi K2 —— 最先进的开源 MoE 模型证明了 Muon 可以扩展至 15 万亿 token 和 1 万亿参数规模。 2025-07-11
Grok 4：xAI 成功在两年内实现从零到全新 SOTA（顶级）大语言模型的跨越。 2025-07-10
今天没发生什么。 2025-07-09
SmolLM3：最先进的（SOTA）3B 参数开源推理大语言模型。 2025-07-08
今天没发生什么。 2025-07-07
今天没发生什么事。 2025-07-03
今天没什么事。 2025-07-02
今天没发生什么事。 2025-07-01
今天没发生什么特别的事。 2025-06-30
今天没什么事发生。 2025-06-27
OpenAI 发布 Deep Research API (o3/o4-mini) 2025-06-26
上下文工程：远不止于提示词 2025-06-25
Bartz 诉 Anthropic PBC —— “训练用途属于合理使用” 2025-06-24
今天没发生什么。 2025-06-23
Claude Code 与 Codex：悄然兴起的对决 2025-06-20
AI 领域的一些后续小动态：多智能体 (MultiAgents)、Meta-SSI-Scale、Karpathy、AI 工程师。 2025-06-19
扎克伯格开启“超级智能创始人模式”：1亿美元奖金 + 1亿美元以上年薪 + NFDG收购？ 2025-06-18
Gemini 2.5 Pro/Flash 正式发布 (GA)，2.5 Flash-Lite 处于预览阶段。 2025-06-17
中国大模型发布——MiniMax-M1、海螺 2“袋鼠”（Kangaroo）、月之暗面 Kimi-Dev-72B。 2025-06-16
Cognition 对阵 Anthropic：不要构建多智能体 / 如何构建多智能体 2025-06-13
今天没发生什么特别的事。 2025-06-12
高管变动第二期：Scale-Meta、Lamini-AMD 以及 Instacart-OpenAI 2025-06-11
推理模型价格战 2.0：Mistral Magistral + o3 降价 80% + o3-pro 2025-06-10
苹果开放了基础模型 API，但……并没有推出新版 Siri。 2025-06-09
今天没发生什么事。 2025-06-06
Gemini 2.5 Pro (06-05) 在 AI 工程师世界博览会（AI Engineer World’s Fair）上发布。 2025-06-05
AI 工程师世界博览会演讲：第一天 2025-06-04
今天没发生什么事。 2025-06-03
今天没发生什么。 2025-06-02
玛丽·米克尔（Mary Meeker）强势回归：BOND Capital 发布 AI 趋势报告。 2025-05-31
DeepSeek-R1-0528 —— 达到 Gemini 2.5 Pro 级别的模型，最先进的（SOTA）开源权重发布。 2025-05-29
今天没发生什么特别的事。 2025-05-28
Mistral 的 Agents API 与 2025 年的 LLM 操作系统 (LLM OS) 2025-05-27
今天没发生什么事。 2025-05-26
今天没发生什么事。 2025-05-23
Anthropic 发布 Claude 4 Sonnet 和 Opus：记忆功能、智能体能力、Claude Code 以及红队风波。 2025-05-22
OpenAI 以 65 亿美元收购 Jony Ive 的 io 公司；LMArena 获得来自 a16z 的 1 亿美元种子轮融资。 2025-05-21
Google I/O：Gemini 新原生语音、Flash、DeepThink、AI 模式（DeepSearch+Mariner+Astra） 2025-05-20
今天没发生什么事。 2025-05-19
ChatGPT Codex，OpenAI 的首个云端软件工程（SWE）智能体。 2025-05-16
Gemini 的 AlphaEvolve 智能体利用 Gemini 2.0 发现新的数学成果，并在不使用强化学习（RL）的情况下，使 Gemini 的成本降低了 1%。 2025-05-15
Granola 推出团队笔记功能，而 Notion 则上线了会议转写功能。 2025-05-14
今天没发生什么特别的事。 2025-05-13
Prime Intellect 的 INTELLECT-2 和 PRIME-RL 推动了分布式强化学习的发展。 2025-05-12
今天没发生什么事。 2025-05-09
今天没发生什么事。 2025-05-08
AI 工程师世界博览会：第二届，双倍乐趣。 2025-05-07
Gemini 2.5 Pro 预览版 05-06 (I/O 版) —— 最先进的视觉+编程模型 2025-05-06
Cursor 估值达 90 亿美元，OpenAI 以 30 亿美元收购 Windsurf。 2025-05-05
今天没什么事。 2025-05-02
今天没发生什么事。 2025-05-01
ChatGPT 回应 GlazeGate + LMArena 回应 Cohere 2025-04-30
LlamaCon：Meta AI 进军 Llama API 平台业务。 2025-04-29
Qwen 3：涵盖 0.6B 到 235B 的 MoE 全量与基座模型，性能超越 R1 和 o1。 2025-04-28
Cognition 的 DeepWiki，一个涵盖所有 GitHub 仓库的免费百科全书。 2025-04-25
今天没发生什么。 2025-04-24
gpt-image-1 —— ChatGPT 的图像生成模型（容易混淆的是，它并非 4o）现已上线 API。 2025-04-23
今天没发生什么。 2025-04-22
今天没发生什么大事；AINews 更换了邮件服务商。 2025-04-21
Grok 3 和 3-mini API 现已开放。 2025-04-19
Gemini 2.5 Flash 彻底统治了帕累托前沿（Pareto Frontier）。 2025-04-18
OpenAI o3、o4-mini 和 Codex CLI 2025-04-17
QwQ-32B 声称其性能可比肩 DeepSeek R1-671B。 2025-04-16
SOTA 级视频生成：Veo 2 和可灵 2 已面向开发者全面开放 (GA)。 2025-04-16
GPT 4.1：OpenAI 的新主力 2025-04-15
今天没发生什么事。 2025-04-11
今天没发生什么事。 2025-04-11
谷歌的 Agent2Agent (A2A) 协议（或译为：谷歌智能体对智能体协议） 2025-04-10
DeepCoder：达到 O3-mini 级别的完全开源 14B 编程模型 2025-04-09
Llama 4 备受争议的周末发布 2025-04-08
今天没发生什么特别的事。 2025-04-05
今天没发生什么事。 2025-04-04
今天没发生什么。 2025-04-02
今日融资额超过 410 亿美元（OpenAI 估值 3000 亿，Cursor 95 亿，Etched 15 亿） 2025-04-01
今天没发生什么事。 2025-03-28
今天没发生什么事。 2025-03-28
OpenAI 采用 MCP（模型上下文协议）。 2025-03-27
Gemini 2.5 Pro + 4o 原生图像生成 2025-03-26
Halfmoon 推出 Reve Image：由前 Adobe 和 Stability AI 三人组打造的全新 SOTA（最先进）图像模型。 2025-03-25
这周发生了很多小事。 2025-03-22
可提示的韵律、最先进的 ASR 和语义 VAD：OpenAI 全面升级语音 AI 2025-03-20
每 7 个月：智能体自主性的摩尔定律 2025-03-20
今天没发生什么事。 2025-03-18
Cohere 的 Command A 占据开放模型第三位（仅次于 DeepSeek 和 Gemma） 2025-03-18
今天没什么事发生。 2025-03-14
今天没发生什么事。 2025-03-13
Gemma 3 在 Elo 评分上击败了 DeepSeek V3，2.0 Flash 凭借原生图像生成能力超越了 GPT-4o。 2025-03-13
全新的 OpenAI 智能体平台 2025-03-12
今天没发生什么事。 2025-03-10
DeepSeek 开源技术栈 2025-03-08
今天没发生什么特别的事。 2025-03-07
今天没发生什么特别的事。 2025-03-05
Anthropic 的 615 亿美元 E 轮融资。 2025-03-04
今天没发生什么事。 2025-03-01
GPT 4.5 —— 巨型 Orion 发布！ 2025-02-28
通用/产品发布：许多小型发布 2025-02-27
今天没发生什么特别的事。 2025-02-26
Claude 3.7 Sonnet （通常保留原名，也可译为：Claude 3.7 奏鸣曲） 2025-02-25
AI工程师峰会第一天 2025-02-22
今天没发生什么特别的事。 2025-02-21
超大规模实战手册：在 GPU 集群上训练大语言模型 2025-02-20
X.ai 的 Grok 3 与 Mira Murati 的 Thinking Machines 2025-02-18
LLaDA：大语言扩散模型 2025-02-18
今天没发生什么事。 2025-02-15
推理模型已具备接近超人类的编程能力（OpenAI IOI、英伟达内核） 2025-02-14
简讯 (最常用的术语) 2025-02-13
今天没发生什么特别的事。 2025-02-12
今天没发生什么特别的事。 2025-02-11
今天没什么事。 2025-02-08
s1：简单的测试时缩放（以及 Kyutai Hibiki） 2025-02-07
Gemini 2.0 Flash 正式发布（GA），同步推出全新的 Flash Lite、2.0 Pro 以及 Flash Thinking。 2025-02-06
如何扩展你的模型 —— DeepMind（最简洁、常用） 2025-02-05
OpenAI 对标 Gemini 的 Deep Research。 2025-02-04
o3-mini 发布，OpenAI 站在“历史错误的一边” 2025-02-01
Mistral Small 3 24B 和 Tulu 3 405B 2025-01-31
今天没发生什么特别的事。 2025-01-30
今天没什么事。 2025-01-29
DeepSeek 登顶美国 App Store，英伟达股价暴跌 17%。 2025-01-28
TinyZero：只需 30 美元即可复现 DeepSeek R1-Zero。 2025-01-25
OpenAI 发布其首个 AI 智能体 Operator。 2025-01-24
Bespoke-Stratos + Sky-T1：推理领域的 Vicuna+Alpaca 时刻 2025-01-23
星际之门项目（Project Stargate）：耗资 5000 亿美元的数据中心（占美国 GDP 的 1.7%）以及 Gemini 2 Flash Thinking 2。 2025-01-22
DeepSeek R1：性能媲美 o1 的权重开放模型，以及将 1.5B 模型提升至 Sonnet/4o 级别的简单方法。 2025-01-21
今天没发生什么。 2025-01-18
今天没发生什么。 2025-01-17
Titans：在测试时学习记忆 2025-01-16
简讯 2025-01-15
今天没发生什么特别的事。 2025-01-14
Moondream 2025.1.9：在 2B 模型中实现结构化文本、增强 OCR 与视线检测功能。 2025-01-11
今天没发生什么。 2025-01-10
今天没发生什么。 2025-01-09
今天没发生什么。 2025-01-08
PRIME：基于隐式奖励的过程强化 2025-01-07
今天没发生什么事。 2025-01-04
年底没发生什么特别的事。 (最直接的 2024-12-31
今天没发生什么特别的事。 2024-12-31
今天没发生什么事。 2024-12-28
DeepSeek v3：671B（6710亿）参数的细粒度混合专家模型（MoE），在 15T（15万亿）token 上训练而成，算力成本仅为 550 万美元。 2024-12-27
今天没发生什么特别的事。 2024-12-25
这个周末没发生什么特别的事。 2024-12-24
o3 攻克了 AIME、GPQA 和 Codeforces，在 ARC-AGI 上实现了相当于 11 年的跨越式进展，并在 FrontierMath 中取得了 25% 的成绩。 2024-12-21
ModernBert：新款小型检索/分类利器，支持 8k 上下文，训练量达 2T tokens。 2024-12-20
Genesis：面向机器人技术的生成式物理引擎（o1-mini 版本） 2024-12-19
Genesis：面向机器人技术的生成式物理引擎 (o1-2024-12-17) 2024-12-19
继 Gemini 之后，OpenAI 语音模式现在也具备视觉功能了。 2024-12-18
o1 API、Realtime API + WebRTC 中的 4o/4o-mini、DPO 微调。 2024-12-18
Meta Apollo - 支持长达 1 小时的视频理解，SOTA 级开源权重。 2024-12-17
Meta BLT：无需分词器的字节级大语言模型。 2024-12-14
标准直译：谷歌觉醒：Gemini 2.0 及其他 2024-12-12
ChatGPT Canvas 全面开放 (或正式发布) 2024-12-11
OpenAI Sora Turbo 和 Sora.com 2024-12-10
Meta Llama 3.3：以 70B 的价格提供 405B/Nova Pro 级别的性能。 2024-12-06
美元的 ChatGPT Pro 订阅及 o1-full/pro 模型：具备视觉功能，不含 API，且评价褒贬不一。 2024-12-06
今天没发生什么。 2024-12-05
Olympus 正式发布（即 Amazon Nova Micro / Lite / Pro / Premier / Canvas / Reel） 2024-12-04
今天没发生什么事。 2024-12-02
本周平淡收场。 2024-11-29
Qwen with Questions：32B 开源权重推理模型在 GPQA/AIME/Math500 表现上逼近 o1。 2024-11-28
OLMo 2 —— 全新 SOTA 级完全开源大语言模型 2024-11-27
Anthropic 发布模型上下文协议 (Model Context Protocol) 2024-11-26
视觉无处不在：Apple AIMv2 与 Jina CLIP v2 2024-11-22
LMSys 终结了模型版本化 (gpt 4o 1120, gemini exp 1121) 2024-11-22
DeepSeek-R1 声称超越了 o1-preview，并且将会开源。 2024-11-21
Perplexity 开始为你购物。 2024-11-20
Pixtral Large (124B) 凭借更新的 Mistral Large 24.11 击败了 Llama 3.2 90B。 2024-11-19
Stripe 允许智能体（Agents）通过 StripeAgentToolkit 进行支付。 2024-11-16
Gemini (Experimental-1114) 以 1344 的 Elo 分数重夺大语言模型（LLM）排行榜第一。 2024-11-15
Common Corpus：具有溯源信息的 2 万亿开放词元 2024-11-14
BitNet 是个谎言吗？ 2024-11-13
FrontierMath：评估人工智能高级数学推理能力的基准测试 2024-11-12
今天没发生什么事。 2024-11-08
今天没发生什么特别的事。 2024-11-08
今天没发生什么事。 2024-11-07
腾讯的 Hunyuan-Large 声称以更少的数据击败了 DeepSeek-V2 和 Llama3-405B。 2024-11-06
OpenAI 抢在 Anthropic 之前发布了投机性解码。 2024-11-05
今天没发生什么。 2024-11-01
AI 搜索大战已经打响——SearchGPT、Gemini Grounding 及更多内容。 2024-11-01
构建 LLM-as-a-Judge（大模型评委） 2024-10-30
GitHub Copilot 反击 2024-10-30
这个周末没发生什么特别的事。 2024-10-28
今天没发生什么事。 2024-10-26
简单、稳定、可扩展的一致性模型 2024-10-25
今天没什么事发生。 2024-10-24
Claude 3.5 Sonnet (新版) 获“电脑使用” (Computer Use) 功能。 2024-10-23
DocETL：面向复杂文档处理的代理式查询重写与评估。 2024-10-22
DeepSeek Janus 与 Meta SpiRit-LM：解耦的图像与表现力语音全模态。 2024-10-18
今天没发生什么特别的事。 2024-10-18
目前没有证据表明英伟达（Nvidia）的 Llama-3.1-Nemotron-70B-Instruct 模型在测试集上进行了训练（即所谓的“数据污染”或“洗题”）。 2024-10-17
今天没发生什么事。 2024-10-15
这个周末（AI 领域）没发生什么大事。 2024-10-14
今天没发生什么特别的事。 2024-10-11
年人工智能现状 / 2024年人工智能报告 2024-10-10
今天没什么事。 2024-10-10
AI 诺贝尔奖或人工智能诺贝尔奖 2024-10-09
这个周末没什么特别的。 2024-10-08
上下文文档嵌入：cde-small-v1 2024-10-05
Canvas：OpenAI 对标 Claude Artifacts 的产品 2024-10-03
今天技术方面没发生什么大事。 2024-10-02
OpenAI 实时 API 及其他 Dev Day 精彩内容 2024-10-02
液态基础模型：Transformer 的新替代方案 + AI 新闻播客第 2 期 2024-10-01
今天没发生什么特别的事。 2024-09-27
今天没发生什么。 2024-09-26
Llama 3.2：1B/3B 端侧模型与 11B/90B 多模态模型（附带 AI2 Molmo 亮点） 2024-09-25
ChatGPT 高级语音模式 2024-09-25
暴风雨前的宁静 2024-09-23
今天没发生什么特别的事。 2024-09-21
今天没发生什么事。 2024-09-20
o1 横扫 Lmsys Arena 榜单，Qwen 2.5 与 Kyutai Moshi 正式发布。 2024-09-18
今天没发生什么特别的事。 2024-09-18
一个安静的周末 2024-09-17
o1 AMA 总结 2024-09-14
o1：OpenAI 全新的通用推理模型 2024-09-13
Pixtral 12B：Mistral 在多模态领域击败 Llama 2024-09-12
今天没发生什么 (Not Much Happened Today) + AI新闻播客？ 2024-09-11
AIPhone 16：视觉智能手机 2024-09-09
Reflection 70B，由 IT 部门的 Matt 创作。 2024-09-07
Replit Agent —— 为什么大家都抢在 Devin 之前发布了产品（抢占了市场）？ 2024-09-06
SSI、Sakana、You.com 获 11.5 亿美元融资 + Claude 支持 5 亿上下文。 2024-09-05
这个假期周末，大家都在发布一些小东西。 2024-09-04
今天没发生什么特别的事。 2024-08-31
AI 编程之夏：融资 16 亿美元，仅 1 款可用产品。 2024-08-30
Cerebras 推理：更快、更好、且更便宜 2024-08-29
CogVideoX：智谱的开源 Sora 2024-08-28
这个周末没发生什么特别的事。 2024-08-27
Nvidia Minitron：针对 Llama 3.1 更新的大语言模型剪枝与蒸馏技术。 2024-08-23
非常安静的一天 2024-08-23
Ideogram 2 + 伯克利函数调用排行榜 V2 2024-08-22
今天没发生什么。 2024-08-21
DSPy 路线图 2024-08-20
今天没什么事发生。 2024-08-17
今天没什么事。 2024-08-16
Grok 2! 和 ChatGPT-4o-latest 把大家都搞糊涂了。 2024-08-15
Gemini Live（通常直接保留英文名称，也可译为 Gemini 实时对话或 Gemini 实时语音）。 2024-08-14
一个安静的周末 2024-08-12
今天没什么事。 2024-08-10
便宜到无需计费：过去 30 天 AI 价格下调 50-70% 2024-08-09
今天没发生什么事。 2024-08-08
GPT-4o 八月更新 + 100% 结构化输出全面开放（GPT-4o mini 版） 2024-08-07
GPT-4o 八月更新 + 面向所有人的 100% 结构化输出（GPT-4o 八月版） 2024-08-07
Carlini 如何使用 AI 或卡里尼如何使用人工智能 2024-08-05
Execuhires：挑战可汗之怒 2024-08-03
Rombach 等人：发布 FLUX.1 (pro / dev / schnell)，Black Forest Labs 获 3100 万美元种子轮融资。 2024-08-02
Gemma 2 2B + Scope + Shield 2024-08-01
今天没发生什么特别的事。 2024-07-31
Apple Intelligence 测试版 + Segment Anything Model 2 (分割一切模型 2) 2024-07-30
AlphaProof + AlphaGeometry2 距离 IMO 金牌仅差 1 分。 2024-07-26
Mistral Large 2 + 再见（或：安息吧）Mistral 7B, 8x7B, 8x22B 2024-07-24
Llama 3.1：合成数据模型 2024-07-24
Llama 3.1 爆料：8B 版本大幅提升，70B 版本小幅改进，以及 SOTA 级别的开源 405B 模型。 2024-07-23
DataComp-LM：最优秀的开源数据 7B 模型/基准/数据集。 2024-07-20
Mini, Nemo, Turbo, Lite —— 小模型（Smol models）大爆发 (GPT-4o-mini 版) 2024-07-19
Mini, Nemo, Turbo, Lite - 小模型起飞 (GPT4o 版) 2024-07-19
Gemma 2 登顶 /r/LocalLlama 的口碑评测 (vibe check)。 2024-07-17
SciCode：HumanEval 迎来 STEM 博士级升级 2024-07-17
微软 AgentInstruct + Orca 3 2024-07-16
我们解决了幻觉问题。 2024-07-13
FlashAttention 3、PaliGemma、OpenAI 通往超级智能的 5 个等级。 2024-07-12
今天没发生什么特别的事。 2024-07-11
测试时训练 (Test-Time Training)、MobileLLM、Lilian Weng 谈幻觉（外加：Turbopuffer） 2024-07-10
MMLU-Pro 存在的问题 2024-07-09
Qdrant 的 BM42：“请不要相信我们” 2024-07-06
今天没发生什么。 2024-07-03
GraphRAG：知识图谱与 RAG 的结合（或：知识图谱与 RAG 的联姻） 2024-07-03
RouteLLM：RIP Martian？（外加：AINews 结构化摘要更新） 2024-07-02
那个 GPT-4o 演示 2024-06-29
Gemma 2：面向所有人的开放模型 2024-06-28
Mozilla 的 AI 第二幕 2024-06-27
我可否将你比作十四行诗的一天？ 2024-06-26
Gemini Nano：性能达 Gemini Pro 的 50-90%，推理延迟低于 100ms，支持端侧运行，现已在 Chrome Canary 浏览器中上线。 2024-06-25
Shazeer 等人 (2024)：你在推理上多支付了 13 倍以上的费用。 2024-06-22
Claude 碾压编程：92% HumanEval 评分与 Claude.ai Artifacts 功能 2024-06-21
伊利亚在那儿！ 2024-06-20
Gemini 推出上下文缓存功能……事实果真如此吗？ 2024-06-18
这是……OpenQ* 吗？ 2024-06-18
Nemotron-4-340B：英伟达（NVIDIA）推出的新型大型开放模型，基于合成数据构建，非常适合用于生成合成数据。 2024-06-14
混合 SSM/Transformer 架构优于纯 SSM 或纯 Transformer。 2024-06-13
Stable Diffusion 的最后辉煌？ 2024-06-12
弗朗索瓦·肖莱（Francois Chollet）发起 100 万美元 ARC 奖金。 2024-06-11
Talaria：苹果的新型 MLOps 超级武器 2024-06-11
HippoRAG：首先，构建知识图谱。 2024-06-07
Qwen 2 击败了 Llama 3（而我们不知道它是如何做到的） 2024-06-06
条新闻简讯 2024-06-06
今天没什么事。 2024-06-04
Mamba-2：状态空间对偶性 2024-06-03
Anthropic 工具使用功能（GA/正式版）的使用方式 2024-05-31
上下文位置编码 (CoPE) 2024-05-31
万亿 token 上下文，实时，端侧运行？ 2024-05-29
赶紧给安德烈（Andrej）整点 H100 吧。 2024-05-29
后 DPO 时代 (RewardBench) 2024-05-28
部署微调模型的十诫 2024-05-24
Clémentine Fourrier 谈 LLM 评估（LLM evals） 2024-05-23
AI 工程全集，尽在此处 2024-05-23
Anthropic 的“LLM 基因组计划”：在 Claude Sonnet 上学习与钳制 3400 万个特征。 2024-05-21
Skyfall 2024-05-20
Chameleon：Meta 的（尚未发布的）类 GPT-4o 全模态模型。 2024-05-17
Cursor 通过微调 Llama3-70b，在快速文件编辑中实现了超过 1000 token/s 的速度。 2024-05-17
今天没什么事。 2024-05-15
秒看遍 Google I/O 2024-05-14
GPT-4o：全新的全能型 SOTA 前沿模型（GPT-4 Turbo 版本） 2024-05-13
GPT-4o：全新的全能型 SOTA 前沿模型（GPT-4o 版本） 2024-05-13
这句话模仿了著名的拉丁语格言“Quis custodiet ipsos custodes?”（谁来监督监督者？）。 2024-05-11
LMSys 推进 Llama 3 评估分析。 2024-05-10
OpenAI 的公关活动？ 2024-05-09
Kolmogorov-Arnold 网络：MLP 杀手，还是只是“加了料”的 MLP？ 2024-05-07
DeepSeek-V2 性能超越 Mixtral 8x22B：拥有 160 多个专家，且成本仅需一半。 2024-05-06
万美元奖金：在 Kaggle 竞赛中预测 LMSYS 人类偏好。 2024-05-03
评测：下一代 2024-05-02
今天没什么事。 2024-05-02
大语言模型作为陪审团 (LLMs-as-Juries) 2024-05-01
一个安静的周末 2024-04-29
苹果的 OpenELM 采用 DeLighT 架构，仅使用 50% 的数据集便击败了 OLMo。 2024-04-26
Snowflake Arctic：完全开放的 10B+128x4B 稠密-MoE 混合大语言模型 2024-04-26
OpenAI 的 LLM 操作系统指令层级 (Instruction Hierarchy) 2024-04-25
Perplexity，最新的人工智能独角兽。 2024-04-23
FineWeb：15万亿 Token，12年的 CommonCrawl 数据（已去重和过滤，不客气） 2024-04-23
Llama-3-70b 是 GPT-4 级别的开源模型。 2024-04-20
Meta Llama 3 (8B, 70B) 2024-04-19
Mixtral 8x22B Instruct 引发了关于效率的梗。 2024-04-17
Lilian Weng 谈视频扩散模型 2024-04-17
多模态、多维度、多形态 AI 2024-04-15
从零到 GPT：一年进阶之路 2024-04-12
Mergestral、Meta MTIAv2、Cohere Rerank 3、Google Infini-Attention 2024-04-11
音乐的 DALL-E 时刻 2024-04-10
Gemini Pro 和 GPT4T Vision 在同一天正式发布（GA），纯属巧合。 2024-04-10
一位动漫头像的匿名用户在 1 万美元的 A::B 提示词（prompting）挑战中刷新了纪录。 2024-04-09
深度混合：基于 Transformer 的语言模型中的动态计算分配 2024-04-05
Cohere Command R+、Anthropic Claude 工具使用、OpenAI 微调 2024-04-04
ReALM：将指代消解视作语言建模 2024-04-04
今天没什么事。 2024-04-02
AdamW 变成 AaronD 了？ 2024-04-01
基于评估的 AI 工程 2024-03-29
Jamba：混合架构超越 Mixtral 2024-03-28
DBRX：最强开源模型（只是效率并非最高） 2024-03-27
Claude 3 正式成为了“全美超模”（America’s Next Top Model）。 2024-03-27
安德鲁喜欢智能体。 2024-03-26
今天没什么事。 2024-03-22
欢迎来到 /r/LocalLlama！ 2024-03-21
发布与深潜：拐点 + 稳定篇 2024-03-21
世界模拟.exe 2024-03-20
Grok-1 在生物学领域 2024-03-19
MM1：苹果首个多模态大模型 2024-03-15
圆周率日（Pi Day）没发生什么特别的事。 2024-03-14
DeepMind SIMA：一个 AI，9 款游戏，600 个任务，仅限视觉+语言。 2024-03-14
全球首位全自主 AI 工程师 2024-03-12
“修复 Gemma” 或 “改进 Gemma”。 2024-03-12
FSDP+QLoRA：桌面级显卡运行 70B 规模 AI 的解决方案 2024-03-08
Inflection-2.5 性能达到 GPT-4 的 94%，Pi 月活跃用户数（MAU）达 600 万。 2024-03-08
今天没发生什么特别的事。 2024-03-07
Stable Diffusion 3 —— Rombach 和 Esser 再次做到了！ 2024-03-05
Claude 3 刚刚完爆了 GPT-4（不信你看）。 2024-03-04
比特大语言模型时代 2024-03-01
续集之日 (StarCoder, The Stack, Dune, SemiAnalysis) 2024-03-01
……欢迎来到 AI 推特圈！ 2024-02-29
欢迎 Interconnects 和 OpenRouter。 2024-02-27
Mistral Large 令人失望。 2024-02-26
Latent Space 一周年 2024-02-24
Ring Attention：支持超过 100 万上下文 2024-02-23
谷歌 AI：有得有失（Gemma 和 1.5 Pro 表现出色，图像生成遭遇挫折） 2024-02-22
Karpathy 结束“隐身模式”了？ 2024-02-21
公司为 AI 幻觉承担责任，对 AI 工程师来说其实是好事。 2024-02-20
Sora 刷新了 SOTA（行业最高水平）。 2024-02-16
AI 获得记忆 2024-02-15
Smaug (72B) 的剖析或对 Smaug (72B) 的深度解析 2024-02-13
Gemini Ultra 已发布，评价褒贬不一。 2024-02-09
MetaVoice 与告别 Bard (或：别了，Bard) 2024-02-07
Qwen 1.5 发布 2024-02-06
Less Lazy AI” 可以 2024-02-06
AI工程的核心技能 2024-02-04
AI2 发布 OLMo —— 第四个全开放（open-everything）大语言模型。 2024-02-03
对 GPT 的信任度降至历史最低点。 2024-02-02
Miqu 已被证实是 Mistral-medium 的一个早期检查点（checkpoint）。 2024-01-31
CodeLLama 70B 在 HumanEval 评测中击败了 GPT4。 2024-01-30
RWKV “Eagle” v5：该你出招了，Mamba。 2024-01-30
GPT4Turbo A/B 测试：gpt-4-0125-preview 2024-01-26
GPT4Turbo A/B 测试：gpt-4-1106-preview 2024-01-26
Adept Fuyu-Heavy：面向智能体（Agents）的多模态模型 2024-01-25
谷歌攻克了文生视频（Text to Video）难题。 2024-01-25
再见潜扩散，你好沙漏扩散。 2024-01-24
Nightshade 毒害了 AI 艺术……算是吧？ 2024-01-22
奥特曼（Sam Altman）表示：GPT-5 很快就来。 2024-01-22
年1月17日：助力函数调用数据集的众包工作 2024-01-18
年1月16日：ArtificialAnalysis —— 一个全新的模型/托管服务基准测试网站。 2024-01-17
年1月16日：TIES-Merging（或 TIES 合并） 2024-01-16
年1月13-14日：别小看 #提示工程 (#prompt-engineering) 2024-01-16
年1月12日：Anthropic 提出了“潜伏特工”（Sleeper Agents）这一概念。 2024-01-13
年1月11日：混合专家 vs 模型合并 2024-01-12
年1月10日：AI工程师必读的最佳论文汇总。 2024-01-11
年1月9日：Nous Research 获得 500 万美元融资，用于开源人工智能。 2024-01-11
年1月8日：AI 技术栈的四场战争 2024-01-09
年1月6-7日：LlaMA Pro —— PEFT/RAG 的替代方案？？ 2024-01-08
年1月4日：杰夫·贝佐斯投资了 Perplexity 总额 5.2 亿美元的 B 轮融资。 2024-01-05
年1月3日：愿 Coqui 安息 2024-01-04
年1月2日：对 Smol Talk 进行了一些微调。 2024-01-03
年1月1日：如何开启开源 AI 之路 2024-01-03
年12月31日：新年快乐 2024-01-01
年12月30日：所有大语言模型 (LLMs) 超全清单 2023-12-31
年12月29日：TinyLlama 即将到来。 2023-12-30
年12月28日：Smol Talk 更新 2023-12-29
年12月27日：纽约时报诉 OpenAI 2023-12-29
年12月26日：今天没发生什么特别的事。 2023-12-29
年12月25日：圣诞节发布的 Nous Hermes 2 Yi 34B 2023-12-26
年12月24日：Dolphin Mixtral 8x7b 太疯狂了。 2023-12-26
年12月23日：2023年 NeurIPS 最佳论文 2023-12-24
年12月22日：Anyscale 对基准测试的批评 2023-12-23
年12月21日：AI 现状（LangChain 视角） 2023-12-22
年12月20日：Project Obsidian —— 来自 Nous 的多模态 Mistral 7B 2023-12-21
年12月19日：人人都爱 OpenRouter 2023-12-20
年12月18日：为了好玩和获利而对 Mistral 进行煤气灯操控 (Gaslighting) 2023-12-19
年12月16日：字节跳动被 OpenAI 暂停使用权限。 2023-12-16
年12月15日：Mixtral-Instruct 击败了 Gemini Pro（并与 GPT3.5 持平） 2023-12-15
年12月14日：1000万美元用于超级对齐 (Superalignment) 2023-12-14
年12月13日，SOLAR 10.7B 性能超越了 Mistral 7B？ 2023-12-13
年12月12日：迈向 LangChain 0.1 2023-12-13
年12月11日：Mixtral 击败了 GPT3.5 和 Llama2-70B。 2023-12-11
年12月10日：今天没发生什么特别的事。 2023-12-10
年12月9日：Mixtral 狂潮 2023-12-09
年12月8日 - Mamba vs Mistral vs Hyena 2023-12-08
年12月7日：Anthropic 表示这是“技能问题”（skill issue）。 2023-12-07
谷歌的 Gemini……靠谱吗？ 2023-12-06