AI News / 中文同步
AI News 中文同步版
自动同步自 smol-ai/ainews-web-2025,由 AI 并行翻译。
说明
每日自动同步与翻译,保留原文结构,方便检索与阅读。
- 今天没发生什么事。 2026-03-30
- 今天没发生什么事。 2026-03-27
- 今天没发生什么特别的事。 2026-03-24
- 今天没发生什么特别的事。 2026-03-24
- 今天没发生什么特别的事。 2026-03-24
- 今天没发生什么事。 2026-03-24
- 今天没发生什么特别的事。 2026-03-23
- 今天没什么事。 2026-03-20
- 今天没发生什么特别的事。 2026-03-19
- MiniMax 2.7:以 1/3 的成本实现 GLM-5 级性能,SOTA 级开源模型。 2026-03-18
- 今天没发生什么事。 2026-03-16
- 今天没发生什么特别的事。 2026-03-16
- 今天没发生什么特别的事。 2026-03-12
- 今天没什么事。 2026-03-11
- 今天没发生什么特别的事。 2026-03-10
- Yann LeCun 的 AMI Labs 获 10.3 亿美元种子轮融资成立,旨在围绕 JEPA 构建世界模型。 2026-03-10
- 自动化研究:递归式自我提升的火花 2026-03-09
- 今天没发生什么特别的事。 2026-03-06
- GPT 5.4 2026-03-05
- 今天也没什么大事。 2026-03-04
- 今天没什么事。 2026-03-03
- 今天没发生什么特别的事。 2026-03-02
- OpenAI 完成了来自亚马逊、英伟达(NVIDIA)和软银(SoftBank)的 1100 亿美元融资,这是历史上规模最大的初创公司融资,投后估值达到 8400 亿美元。 2026-02-27
- OpenAI 完成了来自亚马逊、英伟达(NVIDIA)和软银(SoftBank)的 1100 亿美元融资,这是历史上规模最大的初创公司融资,投后估值达到 8400 亿美元。 2026-02-27
- Nano Banana 2(即 Gemini 3.1 Flash Image Preview):新的 SOTA 图像生成模型 2026-02-26
- Gemini Nano 香蕉 2 2026-02-26
- Nano Banana 2(即 Gemini 3.1 Flash Image Preview):新的 SOTA 图像生成模型 2026-02-26
- 智能体工程:2025年12月到底发生了什么? 2026-02-25
- 智能体工程:2025年12月到底发生了什么? 2026-02-25
- Claude Code 周年庆 + 新品发布:Qwen 3.5、Cursor 演示、Cognition Devin 2.2、Inception Mercury 2。 2026-02-24
- Anthropic 指控 DeepSeek、月之暗面(Moonshot AI)和 MiniMax 进行了“工业规模的蒸馏攻击”。 2026-02-24
- Claude Code 周年庆 + 新品发布:Qwen 3.5、Cursor 演示、Cognition Devin 2.2、Inception Mercury 2。 2026-02-24
- Anthropic 指控 DeepSeek(深度求索)、Moonshot(月之暗面)和 MiniMax 进行了“工业级规模的蒸馏攻击”。 2026-02-24
- Anthropic 指控 DeepSeek、月之暗面(Moonshot AI)和 MiniMax 进行了“工业规模的蒸馏攻击”。 2026-02-24
- 今天没发生什么事。 2026-02-21
- 今天没发生什么事。 2026-02-21
- Gemini 3.1 Pro:在 ARC-AGI 2 测试中表现达到 3.0 的两倍。 2026-02-19
- Gemini 3.1 Pro:在 ARC-AGI 2 测试中表现达到 3.0 的两倍。 2026-02-19
- 今天没发生什么特别的事。 2026-02-18
- 今天没发生什么特别的事。 2026-02-18
- Claude Sonnet 4.6:4.5 版本的利落升级,整体表现更佳,但仍有一些注意事项。 2026-02-17
- Claude Sonnet 4.6:4.5 版本的利落升级,整体表现更佳,但仍有一些注意事项。 2026-02-17
- Qwen3.5-397B-A17B:Open-Opus 级别中最小且非常高效的模型。 2026-02-16
- Qwen3.5-397B-A17B:Open-Opus 级别中最小且非常高效的模型。 2026-02-16
- Qwen3.5-397B-A17B:Open-Opus 系列中最小的级别,是一款非常高效的模型。 2026-02-16
- MiniMax-M2.5:顶尖(SOTA)级编程、搜索、工具调用能力,仅需 $1/小时。 2026-02-13
- MiniMax-M2.5:顶尖(SOTA)级编程、搜索、工具调用能力,仅需 $1/小时。 2026-02-13
- 新款 Gemini 3 Deep Think(深度思考版),Anthropic 以 3800 亿美元估值融资 300 亿美元,GPT-5.3-Codex Spark,MiniMax M2.5。 2026-02-12
- 新款 Gemini 3 Deep Think(深度思考版),Anthropic 以 3800 亿美元估值融资 300 亿美元,GPT-5.3-Codex Spark,MiniMax M2.5。 2026-02-12
- Z.ai GLM-5:全新 SOTA 开源权重型大语言模型 2026-02-11
- Z.ai GLM-5:全新 SOTA 开源权重型大语言模型 2026-02-11
- Qwen-Image 2.0 和 Seedance 2.0 2026-02-10
- Qwen-Image 2.0 和 Seedance 2.0 2026-02-10
- 今天没发生什么特别的事。 2026-02-09
- 今天没发生什么特别的事。 2026-02-09
- 今天没什么事。 2026-02-06
- OpenAI 与 Anthropic 开战:Claude Opus 4.6 对阵 GPT 5.3 Codex 2026-02-05
- ElevenLabs 以 110 亿美元估值完成 5 亿美元 D 轮融资;Cerebras 以 230 亿美元估值完成 10 亿美元 H 轮融资;从 Vibe Coding(氛围编码)转向 Agentic Engineering(智能… 2026-02-04
- 上下文图谱:是噱头还是真正的万亿美元机遇? 2026-02-03
- OpenAI Codex 应用:VSCode 分支的终结、多任务工作树、技能自动化。 2026-02-02
- MoltBook 占领了时间线。 2026-01-30
- xAI Grok Imagine API —— 排名第一的视频模型,拥有最优的价格与延迟表现 —— 并且正在与 SpaceX 合并。 2026-01-29
- 今天没什么事。 2026-01-28
- Moonshot Kimi K2.5 —— 性能超越 Sonnet 4.5 且成本仅需一半;全球领先(SOTA)开源模型;首款原生图像+视频模型;支持 100 路并行智能体集群(Agent Swarm)管理。 2026-01-27
- Anthropic 在 Claude.ai 中发布 MCP Apps 开放规范。 2026-01-26
- 今天没发生什么特别的事。 2026-01-22
- OpenEvidence(被称为“医生版 ChatGPT”)以 120 亿美元的估值融资 2.5 亿美元,较去年 2 月 10 亿美元的估值增长了 12 倍。 2026-01-21
- 今天没发生什么特别的事。 2026-01-20
- 今天没发生什么特别的事。 2026-01-19
- ChatGPT 开始在免费版中测试广告,并在美国推出每月 8 美元的全新 Go 订阅计划。 2026-01-16
- Open Responses:OpenAI 响应 API 的明确规范,支持 OpenRouter、Ollama、Huggingface、vLLM 等平台。 2026-01-15
- 今天没发生什么特别的事。 2026-01-15
- Anthropic Labs:Cowork、Claude Code、MCP,以及由 Mike Krieger 和 Ben Mann 领导的技能孵化器。 2026-01-13
- Anthropic 实验室:Cowork、Claude Code、MCP,以及由 Mike Krieger 和 Ben Mann 领导的技能孵化器。 2026-01-13
- 苹果公司选择谷歌的 Gemini 为下一代 Siri 提供支持。 2026-01-12
- 今天没发生什么特别的事。 2026-01-09
- 今天没发生什么事。 2026-01-08
- 今天没发生什么特别的事。 2026-01-07
- xAI 完成 200 亿美元 E 轮融资,估值约为 2300 亿美元。 2026-01-06
- 今天没发生什么特别的事。 2026-01-05
- 今天没发生什么特别的事。 2026-01-02
- 今天没发生什么特别的事。 2025-12-31
- 今天没发生什么特别的事。 2025-12-30
- “Meta Superintelligence Labs 以约 40 亿美元收购 Manus AI;此时距离该产品发布仅 9 个月,其年度经常性收入(ARR)已达 1 亿美元。” 2025-12-29
- 今天没发生什么事。 2025-12-26
- 英伟达以 200 亿美元现金收购 Groq(大部分业务);系史上规模最大的“高管雇佣式收购”(execuhire)。 2025-12-24
- 今天没发生什么事。 2025-12-23
- 今天没发生什么事。 2025-12-22
- 今天没发生什么特别的事。 2025-12-19
- Claude Skills 持续扩展:开放标准、目录与组织管理。 2025-12-18
- Gemini 3.0 Flash 预览版:成本仅为 Pro 版的 1/4,但智能程度几乎旗鼓相当,重夺帕累托前沿(Pareto Frontier)。 2025-12-17
- OpenAI GPT Image-1.5 号称超越了在各大竞技场(Arenas)排名第一的 Nano Banana Pro,但在“氛围感测试”(Vibe Checks)中却彻底翻车。 2025-12-16
- NVIDIA Nemotron 3:参数量从 30B 到 500B 的完全开源混合 Mamba-Transformer 模型。 2025-12-15
- 今天没发生什么特别的事。 2025-12-12
- GPT-5.2 (即时/思考/专业版):GDPVal 评分为 74%,成本是 GPT 5.1 的 1.4 倍,发布于 OpenAI 成立 10 周年之际。 2025-12-11
- 今天没发生什么事。 2025-12-10
- MCP -> 智能体 AI 基础,Mistral Devstral 2 2025-12-09
- 今天没发生什么事。 2025-12-08
- 今天没什么事。 2025-12-05
- OpenRouter 人工智能现状报告:一项基于 100 万亿 Token 的实证研究 2025-12-04
- 今天没发生什么特别的事。 2025-12-03
- Mistral 3:Mistral Large 3 + Ministral 3B/8B/14B 开放权重模型 2025-12-02
- DeepSeek V3.2 与 3.2-Speciale:GPT-5 级别高性能开源权重、上下文管理及算力扩展计划 2025-12-02
- 今天没发生什么事。 2025-11-26
- Black Forest Labs FLUX.2 (pro / flex / dev / klein):接近 Nano Banana 的质量,但采用开放权重。 2025-11-25
- Claude Opus 4.5:过去一周内发布的第三款 SOTA(最先进)级编程模型,价格仅为 Opus 的 1/3。 2025-11-24
- AI 工程师代码峰会 2025-11-21
- Nano Banana Pro (Gemini Image Pro) 解决了图像内文字生成、信息图表生成、2K-4K 分辨率以及 Google 搜索溯源(Grounding)等问题。 2025-11-20
- OpenAI 反击:GPT-5.1-Codex-Max (API) 和 GPT 5.1 Pro (ChatGPT) 2025-11-19
- Gemini 3 Pro —— 谷歌 DeepMind (GDM) 新一代前沿模型 6、Gemini 3 Deep Think 以及 Antigravity IDE。 2025-11-18
- xAI Grok 4.1:Text Arena 排名第一、EQ-bench 排名第一,并拥有更出色的创意写作能力。 2025-11-17
- 今天没发生什么特别的事。 2025-11-14
- GPT 5.1 和 SIMA 2 的小幅更新。 2025-11-13
- ChatGPT 中的 GPT 5.1:暂无评测数据,但具备自适应思维与指令遵循能力。 2025-11-12
- 今天没发生什么特别的事。 2025-11-11
- 今天没发生什么特别的事。 2025-11-10
- Terminal-Bench 2.0 与 Harbor 2025-11-07
- Kimi K2 Thinking:1万亿总参数/320亿激活参数,在 HLE、BrowseComp、TauBench 评测中达到 SOTA(业界领先)水平;同时,Soumith 宣布离开 PyTorch。 2025-11-06
- 今天没发生什么事。 2025-11-05
- 今天没发生什么特别的事。 2025-11-04
- 今天没发生什么事。 2025-11-03
- 今天没发生什么特别的事。 2025-10-31
- 今天没发生什么事。 2025-10-30
- Cursor 2.0 与 Composer-1:快速模型与全新智能体 UI 2025-10-29
- OpenAI 完成与微软的合作及营利性重组 + 发布 2028 年 AI 研究员时间线 + 平台/AI 云产品方向 + 下一个 1 万亿美元算力投入。 2025-10-28
- MiniMax M2 230BA10B —— 价格仅为 Claude Sonnet 的 8%,速度快约 2 倍,全新的 SOTA 开源模型。 2025-10-27
- 今天没发生什么事。 2025-10-24
- 今天没发生什么特别的事。 2025-10-23
- 今天没发生什么特别的事。 2025-10-22
- ChatGPT Atlas:OpenAI 的 AI 浏览器 2025-10-21
- DeepSeek-OCR 发现,视觉模型的解码效率可提升 10 倍,准确率达到纯文本水平的约 97%,单张 A100 显卡每天可处理 20 万页(33/200k pages/day/A100)。 2025-10-20
- Karpathy 与 Dwarkesh 的这场访谈推迟了 AGI(通用人工智能)的时间表。 2025-10-17
- Claude Agent Skills —— 是美化版的 AGENTS.md,还是 MCP 杀手? 2025-10-16
- Claude Haiku 4.5 2025-10-15
- 今天没发生什么事。 2025-10-14
- OpenAI Titan XPU:与博通(Broadcom)合作的 10GW 规模自研芯片。 2025-10-13
- 今天没发生什么事。 2025-10-10
- Air Street《2025 年人工智能现状报告》 2025-10-09
- 今天没发生什么事。 2025-10-08
- Gemini 2.5 Computer Use 预览版击败了 Sonnet 4.5 和 OAI CUA。 2025-10-07
- OpenAI 开发者大会:Apps SDK、AgentKit、Codex 正式版 (GA)、GPT-5 Pro 以及 Sora 2 API。 2025-10-06
- 今天没什么事。 2025-10-03
- 今天没发生什么事。 2025-10-02
- Thinking Machines 的 Tinker:基于 LoRA 的大语言模型(LLM)微调 API。 2025-10-01
- Sora 2:全新的视频+音频模型,以及 OpenAI 的首个社交网络。 2025-09-30
- Anthropic Claude Sonnet 4.5、Claude Code 2.0 以及全新的 VS Code 扩展。 2025-09-29
- 今天没发生什么特别的事。 2025-09-26
- GDPVal 研究发现:Claude Opus 4.1 已达到 AGI(通用人工智能)水平的 95%(以 44 种主要白领职业的人类专家为基准)。 2025-09-25
- 今天没什么事。 2025-09-24
- 阿里巴巴云栖大会:4天内发布7款模型(包括 Qwen3-Max、Qwen3-Omni、Qwen3-VL)及520亿美元发展路线图。 2025-09-23
- 英伟达(NVIDIA)将向 OpenAI 投资 1000 亿美元,用于部署 10GW 的 Vera Rubin 架构。 2025-09-22
- Grok 4 Fast:xAI 的蒸馏版前沿模型,Token 效率提升 40%,具备 200 万上下文窗口,速度达 344 tok/s。 2025-09-19
- 软银、英伟达(NVIDIA)和美国政府将分别持有英特尔(Intel)2%、5% 和 10% 的股份,并计划为消费者和数据中心市场开发英特尔 x86 RTX 系统级芯片(SOC)。 2025-09-18
- 今天没发生什么。 2025-09-17
- 今天没什么事。 2025-09-16
- GPT-5 Codex 的发布与 OpenAI 在智能体编程(Agentic Coding)领域的悄然崛起。 2025-09-15
- 今天没发生什么特别的事。 2025-09-13
- Qwen3-Next-80B-A3B-Base:迈向极致的训练与推理效率 2025-09-11
- 甲骨文(Oracle)在赢得3000亿美元的OpenAI合同后,股价单日暴涨36%。 2025-09-10
- 今天没什么事。 2025-09-09
- Cognition 获 100 亿美元 C 轮融资;Smol AI 更新动态。 2025-09-08
- Kimi K2-0905 与 Qwen3-Max 预览版:两款万亿参数(1T)开放权重模型正式发布。 2025-09-05
- 今天没发生什么特别的事。 2025-09-04
- 今天没发生什么特别的事。 2025-09-03
- Anthropic 以 1830 亿美元的估值完成 130 亿美元的 F 轮融资。 2025-09-02
- 今天没发生什么特别的事。 2025-09-01
- 今天没发生什么事。 2025-08-29
- OpenAI Realtime API 正式发布,并推出全新
gpt-realtime模型,价格比 GPT-4o 便宜 20%。 2025-08-28 - OpenAI 更新了 Codex,其 VSCode 扩展现可将任务与 Codex Cloud 进行同步。 2025-08-27
- nano-banana 即 Gemini-2.5-Flash-Image,其 Elo 评分领先 Flux Kontext 170 分,在一致性、编辑能力和多图融合方面达到了业界领先水平(SOTA)。 2025-08-26
- 今天没发生什么事。 2025-08-25
- 今天没发生什么特别的事。 2025-08-22
- Cohere Command A Reasoning 击败了 GPT-OSS-120B 和 DeepSeek R1 0528。 2025-08-21
- DeepSeek V3.1:经过 8400 亿 token 持续预训练,以 11% 的成本击败了 Claude 4 Sonnet。 2025-08-20
- Databricks 的 1000 亿美元 K 轮融资 2025-08-19
- 今天没发生什么特别的事。 2025-08-18
- 今天没发生什么事。 2025-08-15
- 西方开源模型公司获融资:Cohere 以 68 亿美元估值融资 5 亿美元,AI2 获 NSF(美国国家科学基金会)与英伟达 1.52 亿美元资助。 2025-08-14
- 今天没发生什么特别的事。 2025-08-13
- 今天没发生什么事。 2025-08-12
- OpenAI 的 IMO 金牌模型也摘得了 IOI(国际信息学奥林匹克竞赛)金牌。 2025-08-11
- 今天没发生什么事。 2025-08-08
- OpenAI 向全球超过 10 亿用户推出 GPT-5 和 GPT-5 Thinking;-mini 与 -nano 版本助力其占据帕累托前沿(Pareto Frontier)。 2025-08-07
- 今天没什么特别的事。 2025-08-06
- OpenAI 的 gpt-oss 20B 和 120B,Claude Opus 4.1,以及 DeepMind 的 Genie 3。 2025-08-05
- Qwen-Image:SOTA 级文本渲染 + 4o 级图像生成编辑能力,开源权重 MMDiT。 2025-08-04
- Gemini 2.5 Deep Think 终于发布了。 2025-08-01
- Figma 估值超过 500 亿美元的 IPO(首次公开募股) 2025-07-31
- 今天没发生什么事。 2025-07-30
- 今天没发生什么特别的事。 2025-07-29
- GLM-4.5:比 Kimi/Qwen/DeepSeek 更深邃、更硬核、更出色(中国最先进的大模型?) 2025-07-28
- 今天没发生什么特别的事。 2025-07-25
- 个月内增长3倍:Cursor 估值达 280 亿美元,Cognition + Windsurf 估值达 100 亿美元。 2025-07-24
- 今天没发生什么事。 2025-07-23
- 今天没发生什么事。 2025-07-22
- OpenAI (OAI) 和 Google DeepMind (GDM) 宣布,在人类规定的时限内,无需专门的训练或工具,仅通过自然语言推理便取得了国际数学奥林匹克(IMO)金牌水平的成绩。 2025-07-21
- ChatGPT 智能体:全新 o* 模型 + 统一的深度研究浏览器 + Operator 计算机操作功能 + 代码解释器终端 2025-07-17
- 今天没什么事。 2025-07-16
- Voxtral —— Mistral 推出的 SOTA(顶尖水平)语音识别(ASR)模型,包含 3B(mini)和 24B(”small”)两种尺寸,其表现超越了 OpenAI 的 Whisper large-v3。 2025-07-15
- 今天没发生什么事。 2025-07-14
- Kimi K2 —— 最先进的开源 MoE 模型证明了 Muon 可以扩展至 15 万亿 token 和 1 万亿参数规模。 2025-07-11
- Grok 4:xAI 成功在两年内实现从零到全新 SOTA(顶级)大语言模型的跨越。 2025-07-10
- 今天没发生什么。 2025-07-09
- SmolLM3:最先进的(SOTA)3B 参数开源推理大语言模型。 2025-07-08
- 今天没发生什么。 2025-07-07
- 今天没发生什么事。 2025-07-03
- 今天没什么事。 2025-07-02
- 今天没发生什么事。 2025-07-01
- 今天没发生什么特别的事。 2025-06-30
- 今天没什么事发生。 2025-06-27
- OpenAI 发布 Deep Research API (o3/o4-mini) 2025-06-26
- 上下文工程:远不止于提示词 2025-06-25
- Bartz 诉 Anthropic PBC —— “训练用途属于合理使用” 2025-06-24
- 今天没发生什么。 2025-06-23
- Claude Code 与 Codex:悄然兴起的对决 2025-06-20
- AI 领域的一些后续小动态:多智能体 (MultiAgents)、Meta-SSI-Scale、Karpathy、AI 工程师。 2025-06-19
- 扎克伯格开启“超级智能创始人模式”:1亿美元奖金 + 1亿美元以上年薪 + NFDG收购? 2025-06-18
- Gemini 2.5 Pro/Flash 正式发布 (GA),2.5 Flash-Lite 处于预览阶段。 2025-06-17
- 中国大模型发布——MiniMax-M1、海螺 2“袋鼠”(Kangaroo)、月之暗面 Kimi-Dev-72B。 2025-06-16
- Cognition 对阵 Anthropic:不要构建多智能体 / 如何构建多智能体 2025-06-13
- 今天没发生什么特别的事。 2025-06-12
- 高管变动第二期:Scale-Meta、Lamini-AMD 以及 Instacart-OpenAI 2025-06-11
- 推理模型价格战 2.0:Mistral Magistral + o3 降价 80% + o3-pro 2025-06-10
- 苹果开放了基础模型 API,但……并没有推出新版 Siri。 2025-06-09
- 今天没发生什么事。 2025-06-06
- Gemini 2.5 Pro (06-05) 在 AI 工程师世界博览会(AI Engineer World’s Fair)上发布。 2025-06-05
- AI 工程师世界博览会演讲:第一天 2025-06-04
- 今天没发生什么事。 2025-06-03
- 今天没发生什么。 2025-06-02
- 玛丽·米克尔(Mary Meeker)强势回归:BOND Capital 发布 AI 趋势报告。 2025-05-31
- DeepSeek-R1-0528 —— 达到 Gemini 2.5 Pro 级别的模型,最先进的(SOTA)开源权重发布。 2025-05-29
- 今天没发生什么特别的事。 2025-05-28
- Mistral 的 Agents API 与 2025 年的 LLM 操作系统 (LLM OS) 2025-05-27
- 今天没发生什么事。 2025-05-26
- 今天没发生什么事。 2025-05-23
- Anthropic 发布 Claude 4 Sonnet 和 Opus:记忆功能、智能体能力、Claude Code 以及红队风波。 2025-05-22
- OpenAI 以 65 亿美元收购 Jony Ive 的 io 公司;LMArena 获得来自 a16z 的 1 亿美元种子轮融资。 2025-05-21
- Google I/O:Gemini 新原生语音、Flash、DeepThink、AI 模式(DeepSearch+Mariner+Astra) 2025-05-20
- 今天没发生什么事。 2025-05-19
- ChatGPT Codex,OpenAI 的首个云端软件工程(SWE)智能体。 2025-05-16
- Gemini 的 AlphaEvolve 智能体利用 Gemini 2.0 发现新的数学成果,并在不使用强化学习(RL)的情况下,使 Gemini 的成本降低了 1%。 2025-05-15
- Granola 推出团队笔记功能,而 Notion 则上线了会议转写功能。 2025-05-14
- 今天没发生什么特别的事。 2025-05-13
- Prime Intellect 的 INTELLECT-2 和 PRIME-RL 推动了分布式强化学习的发展。 2025-05-12
- 今天没发生什么事。 2025-05-09
- 今天没发生什么事。 2025-05-08
- AI 工程师世界博览会:第二届,双倍乐趣。 2025-05-07
- Gemini 2.5 Pro 预览版 05-06 (I/O 版) —— 最先进的视觉+编程模型 2025-05-06
- Cursor 估值达 90 亿美元,OpenAI 以 30 亿美元收购 Windsurf。 2025-05-05
- 今天没什么事。 2025-05-02
- 今天没发生什么事。 2025-05-01
- ChatGPT 回应 GlazeGate + LMArena 回应 Cohere 2025-04-30
- LlamaCon:Meta AI 进军 Llama API 平台业务。 2025-04-29
- Qwen 3:涵盖 0.6B 到 235B 的 MoE 全量与基座模型,性能超越 R1 和 o1。 2025-04-28
- Cognition 的 DeepWiki,一个涵盖所有 GitHub 仓库的免费百科全书。 2025-04-25
- 今天没发生什么。 2025-04-24
- gpt-image-1 —— ChatGPT 的图像生成模型(容易混淆的是,它并非 4o)现已上线 API。 2025-04-23
- 今天没发生什么。 2025-04-22
- 今天没发生什么大事;AINews 更换了邮件服务商。 2025-04-21
- Grok 3 和 3-mini API 现已开放。 2025-04-19
- Gemini 2.5 Flash 彻底统治了帕累托前沿(Pareto Frontier)。 2025-04-18
- OpenAI o3、o4-mini 和 Codex CLI 2025-04-17
- QwQ-32B 声称其性能可比肩 DeepSeek R1-671B。 2025-04-16
- SOTA 级视频生成:Veo 2 和可灵 2 已面向开发者全面开放 (GA)。 2025-04-16
- GPT 4.1:OpenAI 的新主力 2025-04-15
- 今天没发生什么事。 2025-04-11
- 今天没发生什么事。 2025-04-11
- 谷歌的 Agent2Agent (A2A) 协议(或译为:谷歌智能体对智能体协议) 2025-04-10
- DeepCoder:达到 O3-mini 级别的完全开源 14B 编程模型 2025-04-09
- Llama 4 备受争议的周末发布 2025-04-08
- 今天没发生什么特别的事。 2025-04-05
- 今天没发生什么事。 2025-04-04
- 今天没发生什么。 2025-04-02
- 今日融资额超过 410 亿美元(OpenAI 估值 3000 亿,Cursor 95 亿,Etched 15 亿) 2025-04-01
- 今天没发生什么事。 2025-03-28
- 今天没发生什么事。 2025-03-28
- OpenAI 采用 MCP(模型上下文协议)。 2025-03-27
- Gemini 2.5 Pro + 4o 原生图像生成 2025-03-26
- Halfmoon 推出 Reve Image:由前 Adobe 和 Stability AI 三人组打造的全新 SOTA(最先进)图像模型。 2025-03-25
- 这周发生了很多小事。 2025-03-22
- 可提示的韵律、最先进的 ASR 和语义 VAD:OpenAI 全面升级语音 AI 2025-03-20
- 每 7 个月:智能体自主性的摩尔定律 2025-03-20
- 今天没发生什么事。 2025-03-18
- Cohere 的 Command A 占据开放模型第三位(仅次于 DeepSeek 和 Gemma) 2025-03-18
- 今天没什么事发生。 2025-03-14
- 今天没发生什么事。 2025-03-13
- Gemma 3 在 Elo 评分上击败了 DeepSeek V3,2.0 Flash 凭借原生图像生成能力超越了 GPT-4o。 2025-03-13
- 全新的 OpenAI 智能体平台 2025-03-12
- 今天没发生什么事。 2025-03-10
- DeepSeek 开源技术栈 2025-03-08
- 今天没发生什么特别的事。 2025-03-07
- 今天没发生什么特别的事。 2025-03-05
- Anthropic 的 615 亿美元 E 轮融资。 2025-03-04
- 今天没发生什么事。 2025-03-01
- GPT 4.5 —— 巨型 Orion 发布! 2025-02-28
- 通用/产品发布: 许多小型发布 2025-02-27
- 今天没发生什么特别的事。 2025-02-26
- Claude 3.7 Sonnet (通常保留原名,也可译为:Claude 3.7 奏鸣曲) 2025-02-25
- AI工程师峰会 第一天 2025-02-22
- 今天没发生什么特别的事。 2025-02-21
- 超大规模实战手册:在 GPU 集群上训练大语言模型 2025-02-20
- X.ai 的 Grok 3 与 Mira Murati 的 Thinking Machines 2025-02-18
- LLaDA:大语言扩散模型 2025-02-18
- 今天没发生什么事。 2025-02-15
- 推理模型已具备接近超人类的编程能力(OpenAI IOI、英伟达内核) 2025-02-14
- 简讯 (最常用的术语) 2025-02-13
- 今天没发生什么特别的事。 2025-02-12
- 今天没发生什么特别的事。 2025-02-11
- 今天没什么事。 2025-02-08
- s1:简单的测试时缩放(以及 Kyutai Hibiki) 2025-02-07
- Gemini 2.0 Flash 正式发布(GA),同步推出全新的 Flash Lite、2.0 Pro 以及 Flash Thinking。 2025-02-06
- 如何扩展你的模型 —— DeepMind(最简洁、常用) 2025-02-05
- OpenAI 对标 Gemini 的 Deep Research。 2025-02-04
- o3-mini 发布,OpenAI 站在“历史错误的一边” 2025-02-01
- Mistral Small 3 24B 和 Tulu 3 405B 2025-01-31
- 今天没发生什么特别的事。 2025-01-30
- 今天没什么事。 2025-01-29
- DeepSeek 登顶美国 App Store,英伟达股价暴跌 17%。 2025-01-28
- TinyZero:只需 30 美元即可复现 DeepSeek R1-Zero。 2025-01-25
- OpenAI 发布其首个 AI 智能体 Operator。 2025-01-24
- Bespoke-Stratos + Sky-T1:推理领域的 Vicuna+Alpaca 时刻 2025-01-23
- 星际之门项目(Project Stargate):耗资 5000 亿美元的数据中心(占美国 GDP 的 1.7%)以及 Gemini 2 Flash Thinking 2。 2025-01-22
- DeepSeek R1:性能媲美 o1 的权重开放模型,以及将 1.5B 模型提升至 Sonnet/4o 级别的简单方法。 2025-01-21
- 今天没发生什么。 2025-01-18
- 今天没发生什么。 2025-01-17
- Titans:在测试时学习记忆 2025-01-16
- 简讯 2025-01-15
- 今天没发生什么特别的事。 2025-01-14
- Moondream 2025.1.9:在 2B 模型中实现结构化文本、增强 OCR 与视线检测功能。 2025-01-11
- 今天没发生什么。 2025-01-10
- 今天没发生什么。 2025-01-09
- 今天没发生什么。 2025-01-08
- PRIME:基于隐式奖励的过程强化 2025-01-07
- 今天没发生什么事。 2025-01-04
- 年底没发生什么特别的事。 (最直接的 2024-12-31
- 今天没发生什么特别的事。 2024-12-31
- 今天没发生什么事。 2024-12-28
- DeepSeek v3:671B(6710亿)参数的细粒度混合专家模型(MoE),在 15T(15万亿)token 上训练而成,算力成本仅为 550 万美元。 2024-12-27
- 今天没发生什么特别的事。 2024-12-25
- 这个周末没发生什么特别的事。 2024-12-24
- o3 攻克了 AIME、GPQA 和 Codeforces,在 ARC-AGI 上实现了相当于 11 年的跨越式进展,并在 FrontierMath 中取得了 25% 的成绩。 2024-12-21
- ModernBert:新款小型检索/分类利器,支持 8k 上下文,训练量达 2T tokens。 2024-12-20
- Genesis:面向机器人技术的生成式物理引擎(o1-mini 版本) 2024-12-19
- Genesis:面向机器人技术的生成式物理引擎 (o1-2024-12-17) 2024-12-19
- 继 Gemini 之后,OpenAI 语音模式现在也具备视觉功能了。 2024-12-18
- o1 API、Realtime API + WebRTC 中的 4o/4o-mini、DPO 微调。 2024-12-18
- Meta Apollo - 支持长达 1 小时的视频理解,SOTA 级开源权重。 2024-12-17
- Meta BLT:无需分词器的字节级大语言模型。 2024-12-14
- 标准直译: 谷歌觉醒:Gemini 2.0 及其他 2024-12-12
- ChatGPT Canvas 全面开放 (或 正式发布) 2024-12-11
- OpenAI Sora Turbo 和 Sora.com 2024-12-10
- Meta Llama 3.3:以 70B 的价格提供 405B/Nova Pro 级别的性能。 2024-12-06
- 美元的 ChatGPT Pro 订阅及 o1-full/pro 模型:具备视觉功能,不含 API,且评价褒贬不一。 2024-12-06
- 今天没发生什么。 2024-12-05
- Olympus 正式发布(即 Amazon Nova Micro / Lite / Pro / Premier / Canvas / Reel) 2024-12-04
- 今天没发生什么事。 2024-12-02
- 本周平淡收场。 2024-11-29
- Qwen with Questions:32B 开源权重推理模型在 GPQA/AIME/Math500 表现上逼近 o1。 2024-11-28
- OLMo 2 —— 全新 SOTA 级完全开源大语言模型 2024-11-27
- Anthropic 发布模型上下文协议 (Model Context Protocol) 2024-11-26
- 视觉无处不在:Apple AIMv2 与 Jina CLIP v2 2024-11-22
- LMSys 终结了模型版本化 (gpt 4o 1120, gemini exp 1121) 2024-11-22
- DeepSeek-R1 声称超越了 o1-preview,并且将会开源。 2024-11-21
- Perplexity 开始为你购物。 2024-11-20
- Pixtral Large (124B) 凭借更新的 Mistral Large 24.11 击败了 Llama 3.2 90B。 2024-11-19
- Stripe 允许智能体(Agents)通过 StripeAgentToolkit 进行支付。 2024-11-16
- Gemini (Experimental-1114) 以 1344 的 Elo 分数重夺大语言模型(LLM)排行榜第一。 2024-11-15
- Common Corpus:具有溯源信息的 2 万亿开放词元 2024-11-14
- BitNet 是个谎言吗? 2024-11-13
- FrontierMath:评估人工智能高级数学推理能力的基准测试 2024-11-12
- 今天没发生什么事。 2024-11-08
- 今天没发生什么特别的事。 2024-11-08
- 今天没发生什么事。 2024-11-07
- 腾讯的 Hunyuan-Large 声称以更少的数据击败了 DeepSeek-V2 和 Llama3-405B。 2024-11-06
- OpenAI 抢在 Anthropic 之前发布了投机性解码。 2024-11-05
- 今天没发生什么。 2024-11-01
- AI 搜索大战已经打响——SearchGPT、Gemini Grounding 及更多内容。 2024-11-01
- 构建 LLM-as-a-Judge(大模型评委) 2024-10-30
- GitHub Copilot 反击 2024-10-30
- 这个周末没发生什么特别的事。 2024-10-28
- 今天没发生什么事。 2024-10-26
- 简单、稳定、可扩展的一致性模型 2024-10-25
- 今天没什么事发生。 2024-10-24
- Claude 3.5 Sonnet (新版) 获“电脑使用” (Computer Use) 功能。 2024-10-23
- DocETL:面向复杂文档处理的代理式查询重写与评估。 2024-10-22
- DeepSeek Janus 与 Meta SpiRit-LM:解耦的图像与表现力语音全模态。 2024-10-18
- 今天没发生什么特别的事。 2024-10-18
- 目前没有证据表明英伟达(Nvidia)的 Llama-3.1-Nemotron-70B-Instruct 模型在测试集上进行了训练(即所谓的“数据污染”或“洗题”)。 2024-10-17
- 今天没发生什么事。 2024-10-15
- 这个周末(AI 领域)没发生什么大事。 2024-10-14
- 今天没发生什么特别的事。 2024-10-11
- 年人工智能现状 / 2024年人工智能报告 2024-10-10
- 今天没什么事。 2024-10-10
- AI 诺贝尔奖 或 人工智能诺贝尔奖 2024-10-09
- 这个周末没什么特别的。 2024-10-08
- 上下文文档嵌入:
cde-small-v12024-10-05 - Canvas:OpenAI 对标 Claude Artifacts 的产品 2024-10-03
- 今天技术方面没发生什么大事。 2024-10-02
- OpenAI 实时 API 及其他 Dev Day 精彩内容 2024-10-02
- 液态基础模型:Transformer 的新替代方案 + AI 新闻播客第 2 期 2024-10-01
- 今天没发生什么特别的事。 2024-09-27
- 今天没发生什么。 2024-09-26
- Llama 3.2:1B/3B 端侧模型与 11B/90B 多模态模型(附带 AI2 Molmo 亮点) 2024-09-25
- ChatGPT 高级语音模式 2024-09-25
- 暴风雨前的宁静 2024-09-23
- 今天没发生什么特别的事。 2024-09-21
- 今天没发生什么事。 2024-09-20
- o1 横扫 Lmsys Arena 榜单,Qwen 2.5 与 Kyutai Moshi 正式发布。 2024-09-18
- 今天没发生什么特别的事。 2024-09-18
- 一个安静的周末 2024-09-17
- o1 AMA 总结 2024-09-14
- o1:OpenAI 全新的通用推理模型 2024-09-13
- Pixtral 12B:Mistral 在多模态领域击败 Llama 2024-09-12
- 今天没发生什么 (Not Much Happened Today) + AI新闻播客? 2024-09-11
- AIPhone 16:视觉智能手机 2024-09-09
- Reflection 70B,由 IT 部门的 Matt 创作。 2024-09-07
- Replit Agent —— 为什么大家都抢在 Devin 之前发布了产品(抢占了市场)? 2024-09-06
- SSI、Sakana、You.com 获 11.5 亿美元融资 + Claude 支持 5 亿上下文。 2024-09-05
- 这个假期周末,大家都在发布一些小东西。 2024-09-04
- 今天没发生什么特别的事。 2024-08-31
- AI 编程之夏:融资 16 亿美元,仅 1 款可用产品。 2024-08-30
- Cerebras 推理:更快、更好、且更便宜 2024-08-29
- CogVideoX:智谱的开源 Sora 2024-08-28
- 这个周末没发生什么特别的事。 2024-08-27
- Nvidia Minitron:针对 Llama 3.1 更新的大语言模型剪枝与蒸馏技术。 2024-08-23
- 非常安静的一天 2024-08-23
- Ideogram 2 + 伯克利函数调用排行榜 V2 2024-08-22
- 今天没发生什么。 2024-08-21
- DSPy 路线图 2024-08-20
- 今天没什么事发生。 2024-08-17
- 今天没什么事。 2024-08-16
- Grok 2! 和 ChatGPT-4o-latest 把大家都搞糊涂了。 2024-08-15
- Gemini Live(通常直接保留英文名称,也可译为 Gemini 实时对话 或 Gemini 实时语音)。 2024-08-14
- 一个安静的周末 2024-08-12
- 今天没什么事。 2024-08-10
- 便宜到无需计费:过去 30 天 AI 价格下调 50-70% 2024-08-09
- 今天没发生什么事。 2024-08-08
- GPT-4o 八月更新 + 100% 结构化输出全面开放(GPT-4o mini 版) 2024-08-07
- GPT-4o 八月更新 + 面向所有人的 100% 结构化输出(GPT-4o 八月版) 2024-08-07
- Carlini 如何使用 AI 或 卡里尼如何使用人工智能 2024-08-05
- Execuhires:挑战可汗之怒 2024-08-03
- Rombach 等人:发布 FLUX.1 (pro / dev / schnell),Black Forest Labs 获 3100 万美元种子轮融资。 2024-08-02
- Gemma 2 2B + Scope + Shield 2024-08-01
- 今天没发生什么特别的事。 2024-07-31
- Apple Intelligence 测试版 + Segment Anything Model 2 (分割一切模型 2) 2024-07-30
- AlphaProof + AlphaGeometry2 距离 IMO 金牌仅差 1 分。 2024-07-26
- Mistral Large 2 + 再见(或:安息吧)Mistral 7B, 8x7B, 8x22B 2024-07-24
- Llama 3.1:合成数据模型 2024-07-24
- Llama 3.1 爆料:8B 版本大幅提升,70B 版本小幅改进,以及 SOTA 级别的开源 405B 模型。 2024-07-23
- DataComp-LM:最优秀的开源数据 7B 模型/基准/数据集。 2024-07-20
- Mini, Nemo, Turbo, Lite —— 小模型(Smol models)大爆发 (GPT-4o-mini 版) 2024-07-19
- Mini, Nemo, Turbo, Lite - 小模型起飞 (GPT4o 版) 2024-07-19
- Gemma 2 登顶 /r/LocalLlama 的口碑评测 (vibe check)。 2024-07-17
- SciCode:HumanEval 迎来 STEM 博士级升级 2024-07-17
- 微软 AgentInstruct + Orca 3 2024-07-16
- 我们解决了幻觉问题。 2024-07-13
- FlashAttention 3、PaliGemma、OpenAI 通往超级智能的 5 个等级。 2024-07-12
- 今天没发生什么特别的事。 2024-07-11
- 测试时训练 (Test-Time Training)、MobileLLM、Lilian Weng 谈幻觉(外加:Turbopuffer) 2024-07-10
- MMLU-Pro 存在的问题 2024-07-09
- Qdrant 的 BM42:“请不要相信我们” 2024-07-06
- 今天没发生什么。 2024-07-03
- GraphRAG:知识图谱与 RAG 的结合(或:知识图谱与 RAG 的联姻) 2024-07-03
- RouteLLM:RIP Martian?(外加:AINews 结构化摘要更新) 2024-07-02
- 那个 GPT-4o 演示 2024-06-29
- Gemma 2:面向所有人的开放模型 2024-06-28
- Mozilla 的 AI 第二幕 2024-06-27
- 我可否将你比作十四行诗的一天? 2024-06-26
- Gemini Nano:性能达 Gemini Pro 的 50-90%,推理延迟低于 100ms,支持端侧运行,现已在 Chrome Canary 浏览器中上线。 2024-06-25
- Shazeer 等人 (2024):你在推理上多支付了 13 倍以上的费用。 2024-06-22
- Claude 碾压编程:92% HumanEval 评分与 Claude.ai Artifacts 功能 2024-06-21
- 伊利亚在那儿! 2024-06-20
- Gemini 推出上下文缓存功能……事实果真如此吗? 2024-06-18
- 这是……OpenQ* 吗? 2024-06-18
- Nemotron-4-340B:英伟达(NVIDIA)推出的新型大型开放模型,基于合成数据构建,非常适合用于生成合成数据。 2024-06-14
- 混合 SSM/Transformer 架构优于纯 SSM 或纯 Transformer。 2024-06-13
- Stable Diffusion 的最后辉煌? 2024-06-12
- 弗朗索瓦·肖莱(Francois Chollet)发起 100 万美元 ARC 奖金。 2024-06-11
- Talaria:苹果的新型 MLOps 超级武器 2024-06-11
- HippoRAG:首先,构建知识图谱。 2024-06-07
- Qwen 2 击败了 Llama 3(而我们不知道它是如何做到的) 2024-06-06
- 条新闻简讯 2024-06-06
- 今天没什么事。 2024-06-04
- Mamba-2:状态空间对偶性 2024-06-03
- Anthropic 工具使用功能(GA/正式版)的使用方式 2024-05-31
- 上下文位置编码 (CoPE) 2024-05-31
- 万亿 token 上下文,实时,端侧运行? 2024-05-29
- 赶紧给安德烈(Andrej)整点 H100 吧。 2024-05-29
- 后 DPO 时代 (RewardBench) 2024-05-28
- 部署微调模型的十诫 2024-05-24
- Clémentine Fourrier 谈 LLM 评估(LLM evals) 2024-05-23
- AI 工程全集,尽在此处 2024-05-23
- Anthropic 的“LLM 基因组计划”:在 Claude Sonnet 上学习与钳制 3400 万个特征。 2024-05-21
- Skyfall 2024-05-20
- Chameleon:Meta 的(尚未发布的)类 GPT-4o 全模态模型。 2024-05-17
- Cursor 通过微调 Llama3-70b,在快速文件编辑中实现了超过 1000 token/s 的速度。 2024-05-17
- 今天没什么事。 2024-05-15
- 秒看遍 Google I/O 2024-05-14
- GPT-4o:全新的全能型 SOTA 前沿模型(GPT-4 Turbo 版本) 2024-05-13
- GPT-4o:全新的全能型 SOTA 前沿模型(GPT-4o 版本) 2024-05-13
- 这句话模仿了著名的拉丁语格言“Quis custodiet ipsos custodes?”(谁来监督监督者?)。 2024-05-11
- LMSys 推进 Llama 3 评估分析。 2024-05-10
- OpenAI 的公关活动? 2024-05-09
- Kolmogorov-Arnold 网络:MLP 杀手,还是只是“加了料”的 MLP? 2024-05-07
- DeepSeek-V2 性能超越 Mixtral 8x22B:拥有 160 多个专家,且成本仅需一半。 2024-05-06
- 万美元奖金:在 Kaggle 竞赛中预测 LMSYS 人类偏好。 2024-05-03
- 评测:下一代 2024-05-02
- 今天没什么事。 2024-05-02
- 大语言模型作为陪审团 (LLMs-as-Juries) 2024-05-01
- 一个安静的周末 2024-04-29
- 苹果的 OpenELM 采用 DeLighT 架构,仅使用 50% 的数据集便击败了 OLMo。 2024-04-26
- Snowflake Arctic:完全开放的 10B+128x4B 稠密-MoE 混合大语言模型 2024-04-26
- OpenAI 的 LLM 操作系统指令层级 (Instruction Hierarchy) 2024-04-25
- Perplexity,最新的人工智能独角兽。 2024-04-23
- FineWeb:15万亿 Token,12年的 CommonCrawl 数据(已去重和过滤,不客气) 2024-04-23
- Llama-3-70b 是 GPT-4 级别的开源模型。 2024-04-20
- Meta Llama 3 (8B, 70B) 2024-04-19
- Mixtral 8x22B Instruct 引发了关于效率的梗。 2024-04-17
- Lilian Weng 谈视频扩散模型 2024-04-17
- 多模态、多维度、多形态 AI 2024-04-15
- 从零到 GPT:一年进阶之路 2024-04-12
- Mergestral、Meta MTIAv2、Cohere Rerank 3、Google Infini-Attention 2024-04-11
- 音乐的 DALL-E 时刻 2024-04-10
- Gemini Pro 和 GPT4T Vision 在同一天正式发布(GA),纯属巧合。 2024-04-10
- 一位动漫头像的匿名用户在 1 万美元的 A::B 提示词(prompting)挑战中刷新了纪录。 2024-04-09
- 深度混合:基于 Transformer 的语言模型中的动态计算分配 2024-04-05
- Cohere Command R+、Anthropic Claude 工具使用、OpenAI 微调 2024-04-04
- ReALM:将指代消解视作语言建模 2024-04-04
- 今天没什么事。 2024-04-02
- AdamW 变成 AaronD 了? 2024-04-01
- 基于评估的 AI 工程 2024-03-29
- Jamba:混合架构超越 Mixtral 2024-03-28
- DBRX:最强开源模型(只是效率并非最高) 2024-03-27
- Claude 3 正式成为了“全美超模”(America’s Next Top Model)。 2024-03-27
- 安德鲁喜欢智能体。 2024-03-26
- 今天没什么事。 2024-03-22
- 欢迎来到 /r/LocalLlama! 2024-03-21
- 发布与深潜:拐点 + 稳定篇 2024-03-21
- 世界模拟.exe 2024-03-20
- Grok-1 在生物学领域 2024-03-19
- MM1:苹果首个多模态大模型 2024-03-15
- 圆周率日(Pi Day)没发生什么特别的事。 2024-03-14
- DeepMind SIMA:一个 AI,9 款游戏,600 个任务,仅限视觉+语言。 2024-03-14
- 全球首位全自主 AI 工程师 2024-03-12
- “修复 Gemma” 或 “改进 Gemma”。 2024-03-12
- FSDP+QLoRA:桌面级显卡运行 70B 规模 AI 的解决方案 2024-03-08
- Inflection-2.5 性能达到 GPT-4 的 94%,Pi 月活跃用户数(MAU)达 600 万。 2024-03-08
- 今天没发生什么特别的事。 2024-03-07
- Stable Diffusion 3 —— Rombach 和 Esser 再次做到了! 2024-03-05
- Claude 3 刚刚完爆了 GPT-4(不信你看)。 2024-03-04
- 比特大语言模型时代 2024-03-01
- 续集之日 (StarCoder, The Stack, Dune, SemiAnalysis) 2024-03-01
- ……欢迎来到 AI 推特圈! 2024-02-29
- 欢迎 Interconnects 和 OpenRouter。 2024-02-27
- Mistral Large 令人失望。 2024-02-26
- Latent Space 一周年 2024-02-24
- Ring Attention:支持超过 100 万上下文 2024-02-23
- 谷歌 AI:有得有失(Gemma 和 1.5 Pro 表现出色,图像生成遭遇挫折) 2024-02-22
- Karpathy 结束“隐身模式”了? 2024-02-21
- 公司为 AI 幻觉承担责任,对 AI 工程师来说其实是好事。 2024-02-20
- Sora 刷新了 SOTA(行业最高水平)。 2024-02-16
- AI 获得记忆 2024-02-15
- Smaug (72B) 的剖析 或 对 Smaug (72B) 的深度解析 2024-02-13
- Gemini Ultra 已发布,评价褒贬不一。 2024-02-09
- MetaVoice 与 告别 Bard (或:别了,Bard) 2024-02-07
- Qwen 1.5 发布 2024-02-06
- Less Lazy AI” 可以 2024-02-06
- AI工程的核心技能 2024-02-04
- AI2 发布 OLMo —— 第四个全开放(open-everything)大语言模型。 2024-02-03
- 对 GPT 的信任度降至历史最低点。 2024-02-02
- Miqu 已被证实是 Mistral-medium 的一个早期检查点(checkpoint)。 2024-01-31
- CodeLLama 70B 在 HumanEval 评测中击败了 GPT4。 2024-01-30
- RWKV “Eagle” v5:该你出招了,Mamba。 2024-01-30
- GPT4Turbo A/B 测试:gpt-4-0125-preview 2024-01-26
- GPT4Turbo A/B 测试:gpt-4-1106-preview 2024-01-26
- Adept Fuyu-Heavy:面向智能体(Agents)的多模态模型 2024-01-25
- 谷歌攻克了文生视频(Text to Video)难题。 2024-01-25
- 再见潜扩散,你好沙漏扩散。 2024-01-24
- Nightshade 毒害了 AI 艺术……算是吧? 2024-01-22
- 奥特曼(Sam Altman)表示:GPT-5 很快就来。 2024-01-22
- 年1月17日:助力函数调用数据集的众包工作 2024-01-18
- 年1月16日:ArtificialAnalysis —— 一个全新的模型/托管服务基准测试网站。 2024-01-17
- 年1月16日:TIES-Merging(或 TIES 合并) 2024-01-16
- 年1月13-14日:别小看 #提示工程 (#prompt-engineering) 2024-01-16
- 年1月12日:Anthropic 提出了“潜伏特工”(Sleeper Agents)这一概念。 2024-01-13
- 年1月11日:混合专家 vs 模型合并 2024-01-12
- 年1月10日:AI工程师必读的最佳论文汇总。 2024-01-11
- 年1月9日:Nous Research 获得 500 万美元融资,用于开源人工智能。 2024-01-11
- 年1月8日:AI 技术栈的四场战争 2024-01-09
- 年1月6-7日:LlaMA Pro —— PEFT/RAG 的替代方案?? 2024-01-08
- 年1月4日:杰夫·贝佐斯投资了 Perplexity 总额 5.2 亿美元的 B 轮融资。 2024-01-05
- 年1月3日:愿 Coqui 安息 2024-01-04
- 年1月2日:对 Smol Talk 进行了一些微调。 2024-01-03
- 年1月1日:如何开启开源 AI 之路 2024-01-03
- 年12月31日:新年快乐 2024-01-01
- 年12月30日:所有大语言模型 (LLMs) 超全清单 2023-12-31
- 年12月29日:TinyLlama 即将到来。 2023-12-30
- 年12月28日:Smol Talk 更新 2023-12-29
- 年12月27日:纽约时报 诉 OpenAI 2023-12-29
- 年12月26日:今天没发生什么特别的事。 2023-12-29
- 年12月25日:圣诞节发布的 Nous Hermes 2 Yi 34B 2023-12-26
- 年12月24日:Dolphin Mixtral 8x7b 太疯狂了。 2023-12-26
- 年12月23日:2023年 NeurIPS 最佳论文 2023-12-24
- 年12月22日:Anyscale 对基准测试的批评 2023-12-23
- 年12月21日:AI 现状(LangChain 视角) 2023-12-22
- 年12月20日:Project Obsidian —— 来自 Nous 的多模态 Mistral 7B 2023-12-21
- 年12月19日:人人都爱 OpenRouter 2023-12-20
- 年12月18日:为了好玩和获利而对 Mistral 进行煤气灯操控 (Gaslighting) 2023-12-19
- 年12月16日:字节跳动被 OpenAI 暂停使用权限。 2023-12-16
- 年12月15日:Mixtral-Instruct 击败了 Gemini Pro(并与 GPT3.5 持平) 2023-12-15
- 年12月14日:1000万美元用于超级对齐 (Superalignment) 2023-12-14
- 年12月13日,SOLAR 10.7B 性能超越了 Mistral 7B? 2023-12-13
- 年12月12日:迈向 LangChain 0.1 2023-12-13
- 年12月11日:Mixtral 击败了 GPT3.5 和 Llama2-70B。 2023-12-11
- 年12月10日:今天没发生什么特别的事。 2023-12-10
- 年12月9日:Mixtral 狂潮 2023-12-09
- 年12月8日 - Mamba vs Mistral vs Hyena 2023-12-08
- 年12月7日:Anthropic 表示这是“技能问题”(skill issue)。 2023-12-07
- 谷歌的 Gemini……靠谱吗? 2023-12-06