type
status
date
slug
summary
tags
category
icon
password
我其实并不想写一篇“骂产品”的文章。
但有些遗憾憋了一年多,不写出来,总觉得对不起自己走过的那段弯路。
1. 一个五笔用户的日常撕裂
在电脑上,我一直用的是 清歌五笔。
这是我用过的 Mac 上体验最好的五笔输入法,没有之一,考虑到键盘输入是一种肌肉记忆,我一直未能切换到拼音输入法来。
而在手机上,我几乎只用 讯飞拼音(语音)输入法。
这个组合在很长一段时间里是和谐的:
- 电脑输入 → 五笔
- 手机输入 → 讯飞
直到前年。
随着Ai的来临,我们这样的产品人开始长时间大范围的使用 vibe coding,每天都需要长时间地与 IDE 键盘对话。
不是写几句提示,而是几十万字规模的对话量。

然后问题就来了。
键盘输入量太大了,我不得不在 Mac 上也安装讯飞输入法。
但肌肉记忆是不会讲道理的——
- 打字时,我会下意识切回五笔
- 需要语音时,又得切回讯飞输入法
- 再点开它里面的“语音输入”子功能
注意,这里真正让我崩溃的点在于:
我不是在两个输入法之间切换,而是在「一个输入法」和「另一个输入法的某个子功能」之间切换。
这个一天几百上千次的操作链路长到让人心累。
2. Karabiner、忍耐,以及失败的临时方案
为了缓解这个问题,2024 年 2 月,我和 pimgeek 用 Karabiner 做了一个快捷版的语音输入方案。
思路很简单:
- 用快捷键fn
- 快速拉起语音
- 快速回到原输入法
勉强实现了。但是我忍了。

这一忍,就是一年。
3. 我自己写了一个“输入法搬运工”
2025 年初,忍耐到极限之后,我干了一件很程序员的事:
我用 web coding 给自己写了一个 Mac App。
原理超简单:
用户长按fn ➡️ 程序帮忙切换到讯飞 ➡️ 然后点开语音听写 ➡️ 等待用户说话 ➡️ 用户松开fn ➡️ 程序帮忙切换回初始输入法(比如五笔/鹤形),方便用户继续输入或修改


当时我在即刻社区写道:
Mac 电脑的语音输入法来了, 以后和 Cursor 聊天,再也不打字了。 动嘴编程时代来临 😄为 Mac 电脑增加一键临时语音输入法
- 没有大模型
- 没有 API
- 没有 AI 润色
- 没有双语翻译
就是忠实地把语音转成文字,借助讯飞输入法本身的能力,把断句和标点做好,远胜过 Mac 自带的听写。
我还录了一个演示视频(视频 1)。
我特别强调:
长按 Fn 键直接输入
这是为了和手机上的讯飞输入法,或微信语音转文字,保持同样的使用经验。
[视频]
那一刻,我是真的开心。
4. “语流”,以及一群兴奋的陌生人
很有意思的是,这个想法启发了即刻里另一位朋友ErlichLiu也迅速做了一个类似的功能。他把这个功能发到了小红书,收获了大量期待。
一周后,我将我的“讯飞语音搬运工”升级了一个新版本,给它起了个名字:
语流
[视频]
甚至,我还建了一个用户体验群。很快进来了一堆朋友,都想试用。那一刻我第一次意识到:
这不是我一个人的痛点。
5. 苹果上架失败:我不是输入法,我只是个搬运工
接下来,我开始尝试把这个 App 上架到 Mac App Store。
结果是——
失败。

从 1 月到 3 月,整整一个多月。
我提交了五六次申诉,我反复向苹果解释:
- 我不是在做一个新的语音输入法
- 我没有任何模型
- 没有 API
- 不需要登录
- 不需要麦克风权限
说白了,这就是一个为非拼音输入法用户服务的语音输入“搬运工”,仅此而已。但这不符合苹果的“作为一个独立应用”的标准。

顺便说一句:Mac 自带的 F5 听写真的烂透了。识别错误、标点缺失,唯一的优点是系统级,反应快。
最终,我的 【语流】还是没能上架成功。于是我只能自己凑合着用,不过对我“口喷代码”帮助很大。
6. 后来者们,终于来了
在这一年里,我又陆续用了 Whisper Keyboard、Spokenly、代体等Ai加持的语音输入法,再后来,豆包输入法来了,微信输入法也支持语音了,这几天我又看到:智谱也推出了语音输入法。
巧的是——
也是长按 Fn 键。


7. 讯飞,真的错过了
我现在已经非常习惯使用 闪电说(就是原来的代体)来输入了。他们做得很好,真心推荐给所有朋友。
但我仍然感到一种巨大的遗憾。
讯飞,错过了这一场新的语音输入入口。
作为曾经用户体验最好的输入法之一,
作为离线模型就能做到极高识别度的厂商,
作为一家持续投入 AI 的企业,
作为输入法市场“春秋五霸”之一——
他们似乎毫无作为。
事实上,早在很久之前,他们只需要一件事:
在 Mac 输入法里,加一个靠谱的快捷键,就能巨大地提升用户体验——特别是在vibe coding刚开始时。
但他们似乎把大部分精力,都花在了皮肤的商业化变现上。
(也许这只是我的个人观察。)
也许,对讯飞来说,输入法只是个很小的项目,没那么重要。
8. 一个更大的时代,正在到来

但我始终觉得:
他们可能没有看明白。
我们正在进入的,不是一个简单的“语音输入”时代。
而是一个——
Her(那部电影)式的入口时代。
语音,不再只是输入方式,而是语义、上下文、意图的第一入口。
这是一个全新的交互范式,而在这个最高频、最自然的入口上,讯飞,慢慢地,把位置让了出来。
这是我觉得非常可惜的地方。