文章作者、来源:0x9999in1,ME News
6 月 7 日早晨。
铃声一响,全国超过千万考生走进考场。
而几乎在同一刻,手机里那些平日里有问必答的 AI 应用,集体"失忆"了。
你打开豆包问一道数学题,它会礼貌地告诉你高考期间该功能暂不可用。你想用夸克拍一道物理题,识别框依然在转,但答案那一栏静悄悄。Kimi、文心一言、通义……你打开任何一家,得到的都是相似的提示。
这不是巧合,是默契。
是中国 AI 行业第三年集体"自律"。
第一年,2024,AI 还显得有点笨拙,是各家临时打补丁;第二年,2025,已经是产品化的标准动作;到了 2026,干脆变成了行业惯例。
为什么?
因为 AI 太能答了。
一道高考数学压轴题,主流大模型的解答正确率早已不是新闻;一篇高考作文,按下回车几秒钟就能交出立意完整、辞藻得体的稿子。考场内是九分钟一道选择,考场外是九秒钟一份完整答卷。这种不对称,对高考的根本逻辑是冲击性的。
监管不会容许这种事情发生。
但更关键的是,AI 厂商自己也不愿意。
一旦哪家应用被舆论锁定为"高考作弊工具",那是品牌危机,是政策红线,是所有 To C 增长努力的瞬间归零。这种风险,谁都担不起。
所以"主动闭嘴",是技术能力做减法,是商业理性做加法。
AI 这一次的克制,不是它不行,是它太行。
考场内的 AI 是哑的。
考场外的 AI 却在另一条赛道上厮杀。
《科创板日报》今年又组织了一场跨厂商作文对决,让六家中外主流大模型同写上海卷。结果出来了:
DeepSeek 与谷歌 Gemini 并列第一,66 分。
Kimi 拿到 63 分,A 等。
豆包 61 分,阿里通义 58 分,并列 B 等。
OpenAI 的 GPT 仅 53 分,C 等垫底。
这个结果,很多人是没想到的。
按照过去两年的国际榜单认知,GPT 一直被视为推理与写作的标杆。可一到中文高考作文这个具体场景,它反而成了那个"水土不服"的留学生。
为什么?
中文高考作文不是逻辑题,是文化题。
它考的是中国语境下的论述方式、文化母题的调用能力,以及那种独有的"既要有思想又要有文采"的尺度感。GPT 的中文训练语料密度、对中国教育审题习惯的对齐、对国内命题方向的理解,都不如本土选手。
这并不是说 GPT 弱了,而是说在这块田里,本土模型有主场优势。
DeepSeek 的并列登顶更值得多说一句。
它不靠多模态花活,不靠铺天盖地的营销,硬靠模型的中文写作底子拿到并列第一。这一点,和它过去一年在开源社区积累的"内功型"口碑是吻合的。
但这场比赛真的有赢家吗?
我倒觉得没有。
因为高考作文从来不是为了写出 66 分的均值之作,它考的是 18 岁少年人独有的那种笨拙真诚、那种青涩锋利。AI 写得再工整,再"得分",也只是一种合格的平庸。
阅卷老师打分,是按规则来的。
可读者被打动,从来不是按规则来的。
AI 在考场内沉默三天,不是退场,是蓄力。
6 月 9 日下午,最后一门外语考试结束铃声响起的那一刻,所有 AI 应用会同时"复工"。
而它们要抢的,不是答题,是志愿。
腾讯元宝联合 QQ 浏览器,在今年高考前就发布了"元宝高考通",号称行业首个高考咨询师 Agent。它的卖点不是答题,是从分数预测、院校匹配、专业解读到模拟填报的一条龙 Agent 化服务。
夸克升级了高考频道,把"高考搜索""智能选志愿""志愿表""志愿报告"四件套全免费开放。夸克本来就是做搜索起家,志愿填报这件事的本质是检索加决策,它的护城河天然在那里。
百度也没闲着,把"2026 高考"模块直接嵌入到文心助手的核心位。一向擅长信息聚合的百度,把它过去十年的志愿填报内容沉淀,加上文心的对话能力,重新打了一遍。
这三家,打法各异。
腾讯走 Agent 路线,强调端到端的决策辅助。
夸克走工具路线,强调免费加开放。
百度走内容路线,强调权威加沉淀。
但他们瞄准的是同一块蛋糕——超过千万考生家庭的志愿填报市场。
这块蛋糕有多大?
过去几年,张雪峰这个名字几乎以一己之力把"志愿填报咨询"这个概念变成了一个高单价赛道。他的圆梦卡曾经一度卖到上万元一张,依然供不应求。家长们愿意为信息差付钱,是因为信息差太大。
而 AI 要做的,恰恰是把这个信息差抹平。
它不需要每个家庭都付上万元,它只需要让一千多万考生中的一部分人,习惯打开它问一句"我这个分数能上什么学校"。
入口建立了,用户画像就建立了。
用户画像建立了,未来的教育、职业、留学、考研、考公服务就都有了承接点。
AI 厂商盯的从来不是这一次填报。
是这个家庭未来 20 年的教育消费链路。
把视角拉远一点。
AI 加教育,不是新故事。
从拍照搜题到 AI 老师,从口语陪练到错题本生成,过去十年这条路上摔倒的公司多到数不清。
为什么这次不一样?
第一,大模型把"个性化"这件事的成本降到了前所未有的低。过去做一份个性化志愿建议,要么靠人工咨询师,要么靠规则引擎跑出来的近似答案。今天,一个对话式 Agent 就能根据你的分数、地域、兴趣、家庭预期,生成一份相对像样的个性化报告。这个成本曲线,是断崖式下降的。
第二,高考是中国家庭情绪浓度最高的一个节点。这种节点级流量,是任何 AI To C 产品都不会放过的。元宝、夸克、文心抢的不只是这三天,是把"AI 是值得信赖的家庭决策助手"这件事种进家长心里。
第三,志愿填报这件事天然适合 AI。它是结构化数据加软性偏好的混合决策,正好是大模型擅长的中间地带——既不像数学有唯一解,也不像哲学完全没法量化。
但问题也藏在这里。
AI 给出的志愿建议,错了谁负责?
过去就出现过个别案例,AI 推荐的院校与考生分数错配,事后厂商一句"仅供参考"打发了事。今年各家都在合规上做了不少加固——免责声明、人工复核、与省考试院数据打通——但本质上,志愿填报这件事的责任边界依然是模糊的。
家长把孩子四年的命运交给一个 Agent,这个信任要不要承接、能不能承接、出了问题怎么承接,是 AI 教育产业接下来三到五年绕不开的核心命题。
监管也在看着。
教育部对涉考 AI 应用的管控只会越来越严,不会越来越松。今年某些功能"上锁",背后是合规优先级的明确信号。
AI 公司必须想明白一件事:在教育这个行业,速度不是第一性原则,可信才是。
写到这里,我突然觉得,这场 AI 与高考的故事,最有意思的不是它们在做什么,而是它们没在做什么。
它们没去答题。
它们没去抢风头。
它们没去把一场关于人的考试变成一场关于机器的展示。
这种克制,是中国 AI 行业过去三年最值得肯定的一个变化。
技术从狂奔到自律,从展示能力到收敛能力,这是一个产业走向成熟的标志。
至于考后的志愿填报战、教育流量战、家庭决策战,那是另一场大戏。
它会很热闹,会有赢家,会有翻车,会重塑张雪峰这样的存在,也会催生新的信息差套利者。
但都跟那一千多万走进考场的孩子无关。
这三天,他们和 AI 都各自闭着嘴。
考场里写下的每一个字,都还是那支笔,那张卷,那个 18 岁。
AI 再聪明,也不会替他们考。
也不必替他们考。

