实体键盘的中文输入效率探讨

网站所有资源都有,可联系VX:kanyingvip

这篇文章是我在 Power+ 一直想讨论的一个话题:如何提升实体键盘的中文输入效率。换成更通俗的语言来说,在电脑上打字的时候,如何能够将打字速度从 60 字/分钟,提升到 80 字/分钟,甚至 100 字/分钟?

输入效率在我看来是非常重要的一件事情,值得我们花时间和精力去学习和探讨。任何微小的提升都有巨大的意义,原因有两点:

  1. 打字是一件高频的事情:尽管语音交互的发展十分迅速,但在我们每天和电子设备的接触中,文字输入仍是最主要的方式。我曾经统计过,我自己在工作日,每天和同事交流、撰写文档等,在电脑上日均会输入 6000–8000 字。以 6000 字来算的话,如果我的打字速度是 60 字/分钟,一共需要 100 分钟;而如果打字速度能够提升到 100 字/分钟,则足足可以省下来 40 分钟,而这还仅仅只是一天的差别。
  2. 输入速度跟上思维速度,更容易进入心流:上面举的例子里,按纯理想的计算方式,60 字/分钟和 100 字/分钟的时间差异,是 40 分钟。但在实际情况里,这个差距会更大。原因非常简单,这里面有一个量变到质变的过程:一旦输入的速度跟上了自己思维的速度,人就更容易进入心流的状态,打字一气呵成,就像人们常说的文思泉涌,喷薄而出。打字速度慢的人,可能就很难体会到这种写作时的心流状态,输入速度就成为了最大的制约。

定义输入效率和本文讨论的范围

我们在讨论输入效率时,和讨论大多数效率问题一样,是希望能够做到又快又对。那么,具体到输入这件事情上,其实重点关注的是两个指标:输入用时输入正确率。也就是说,在保证正确率的前提下,用尽可能少的时间完成输入。

正确率的问题比较复杂,一来是因为它很多时候和输入者的主观意愿和能力是相关的,比如有的人就是分不清「登录」和「登陆」的正确使用场景,以及有些人觉得不影响沟通和理解的情况下,没必要追求绝对的准确,所以会混用「地的得」。二来它和我们使用的输入方式高度相关,例如用拼音输入的人,更可能会出现前后鼻音造成的输入错误;使用五笔的人,更可能出现形体相同的字误输入,如「哉」和「裁」;各种主观和客观的因素会交织影响,因此正确率的问题在本文中我们姑且按下不表。

本文主要还是来讨论比较明确的输入时间的问题:

[rihide]造成输入时间差异最大的两个因素,一是选词时间,二是击键时间。几乎所有的中文输入法,都是围绕这两点展开优化的。

此外,我还想明确一下本文的讨论范围:

  1. 仅讨论实体键盘的输入效率:本文不对虚拟键盘的输入效率展开过多的讨论。从我个人来说,除了不可避免需要在手机上回复微信等时候,我几乎不在手机上进行文字类的录入操作,我也不赞成许多人执念于要统一电脑和手机端的输入法。原因非常简单,两者不可能处在同一个效率层级上:在实体键盘上,你有十根手指在输入;而在虚拟键盘上,其实主要靠两根大拇指在输入。
  2. 仅讨论具有普适性的输入方法:这一点既是指硬件上的,也是指软件上的。从硬件上来说,按维基百科上的记录,中国首届速录大赛上,夺冠的人达到了每分钟 648 字的录入速度。当然,这样的成绩是借助于特定的硬件设备支持的,我们绝大多数人不会有机会去接触和学习这些,在实际的日常生活中,我们使用的设备几乎都是常规键盘。从软件,即输入法这个层面来说,一些生僻或非常小众的输入法也不在我们的讨论之列,像已经被 Windows 移除的郑码,或者是很有新意但的确十分小众的「宫保拼音」。

选词时间:中文存在真正的盲打吗?

我们先来从「选词时间」这个问题开始讨论。

在我小时候刚接触电脑时,大人总是希望我能好好学电脑。至于什么是好好学电脑,他们也说不上来太具体的,但学会盲打却是唯一一个他们能够考查的目标。在当时的大人们看来,考查会不会盲打非常简单,打字的时候能不能不看键盘?

到了后来,我才反思这个问题:中文真的存在盲打吗?这和我们如何定义盲打有关。

在英文输入里,如果你不需要看键盘,那么意味着你已经熟悉了 QWERT 键盘的布局,知道每个单词的拼写应该敲击哪些键位,只需要专注于屏幕上的内容就好了。这时候所谓的盲打,实际上是说你可以聚焦于屏幕上的内容,而不用关心怎么从键盘上打出这些内容来。

但是中文输入有一个本质的区别:汉字并不是 26 个字母组成的,在键盘和屏幕最终展示的内容之间,还多了一个层级:候选词。无论你用的是什么输入法,无论你是不是已经熟悉到不用看键盘,你的注意力永远都不是 100% 聚焦于最终输出的内容上的,因为你还需要时不时地从候选框中,选出自己实际输入的内容。

从这个层面上来看,我认为中文输入不存在真正意义上的盲打,你永远有可能会因为候选框而分心。这个本质的差异,来源于英文输入只有键盘 – 内容两个层级,而中文输入则有键盘 – 候选词 – 内容三个层级。

但是,这并不是说我们没有办法尽可能地使中文输入的体验向盲打靠近。或者换句话说,通过什么手段,能够尽可能地弱化候选框这个层级,让它尽可能少地吸引我们的注意力,最小化选词时间?这就衍生出了两个方向来解决这个问题:

  1. 降低重码率:候选框的存在,是因为同样的键盘输入对应着多个结果。例如用拼音输入 zhong,「中种重仲钟」等等都发 zhong 的音。有没有可能,一串特定的键盘输入,尽可能单独只对应到一个特定的汉字?在 80 年代陆续面世的形码,就是冲着这个目标的。无论是五笔还是郑码,都是通过把汉字拆分成不同的部件来输入,从而减少重码率。
  2. 整句输入+云词库:2006 年,搜狗输入法的出现,让许多人告别了智能 ABC。从那之后,百度输入法、QQ 输入法、讯飞输入法层出不穷,但它们的核心能力却非常相像:整句输入+云词库。这个解决方案也非常容易理解,我们本来输入的目标往往就是一句话,当你输入 zhong 时,会给出一大堆发这个音的候选词。但如果你输入的是 zhongwuchishenme,很容易推断出这句话是「中午吃什么」,那么这时候的 zhong,只会对应到「中」。

整句输入+云词库,通过技术的手段化解了大部分人的使用难题,从那之后,全拼的使用门槛进一步降低,变得足够容易,也足够好用。但是,从追求输入效率的角度来说,这个方案并不是最完美的:

  1. 击键次数仍然很多:输入全拼的击键次数仍然很多,比如要是输入「重庆火锅真香」,用全拼需要「chongqinghuoguozhenxiang 」,假设直接联想正确,加上最后的空格,一共击键 25 次。而如果使用五笔,则只需要键入「tgyd ooqk fhw tjf 」,算上空格,一共是 18 次。当然,在实际情况中,全拼可以使用首字母输入,但大多数情况下,只会在我们十分常用的输入时才会使用,适用面比较窄。如果你没有十足的把握,一般不会使用首字母输入。以「重庆火锅真香」这种例子,如果你直接使用 cqhhzx,输入法的联想结果一般都惨不忍睹。
  2. 纠错成本变高:整句输入 + 云词库的方式,如果联想正确用着很爽,但如果联想错了,特别是中间有一小部分错了,要纠错的体验不那么好。你必须将光标导回中间出错的部分单独修改,有时候花费的时间,甚至比一个一个词单独打还慢。
本意是想输入「你天天吃这个没吃厌吗」

击键时间:如何尽可能少地敲击键盘?

可见,如果你有致于想追求极致的中文输入效率,全拼不应该是你的终点。

从减少击键次数这件事上来说,有两个方案:

(1)使用形码

以五笔为例,在五笔输入法中,一个汉字,最多只需要 4 次按键来完成输入。五笔通过将字拆分成不同的字根,每次只需要字的书写顺序,输入相应的字根即可。如果汉字比较简单,像「村」这样的汉字,是由「木」和「寸」两个字根组成的,只需要输入字根所在的按键 sf 即可。如果一个汉字非常复杂,按五笔输入的规则,也只取前三个字根 + 最后一个字根:例如像「㰉」,完整拆字的话,它是由「木一厶土三人禾」组成的,在五笔中,只需要输入「木一厶(前三个)+禾(最后一个)」键位即可,即 sgct。

五笔的字根键位分布

(2)改造音码

全拼是一种最常见的音码,即用汉字的声音来输入对应的字符。但是,拼音的长度并不固定,即有 bo 这样两个字母组成的,也有 chuang 这样多达六个字母组成的。

有没有可能,短缩拼音的输入方式?双拼就是这样的输入方案:任意一个汉字,只需要按两个键,就能完成拼音的输入。第一个字母代表了声母,第二个字母代表了韵母。声母很容易理解,比如 b/p/m/f/d/t/n/l,本身也只有一个按键,例外的情况可能就是 zh/ch/sh 这几个声母。而韵母则有长有短,即有 a/o/e,也有 ang/eng/ing 这样长一些的。双拼输入法,实际上是将这些韵母指定到了不同的键位上。以下图为例,如果你想输入 song,其实只需要连击 ss 两下,因为 ong 这个韵母被安置在了 s 键上。

微软双拼的键盘布局方案

如果你想追求极致的输入效率

回顾一下上面两个小节,我们分别讨论了如何尽可能地缩短选词时间与击键时间。如果取两者的交集来看的话,似乎「形码」是最优的选项。但是,像五笔这样的输入方式,其学习曲线的陡峭,让许多人望而却步。

如果想追求极致的输入效率,还有没有别的方案呢?

缩短选词时间与缩短击键时间的方案交集

其实,我们还可以从「双拼」入手。前面我们已经介绍了,双拼本身是针对全拼的一种改造,而在双拼的基础上,我们还可以再加一点改造,变成一种称为「双拼加形」的「音形码」,顾名思义,它是一种混合了音码和形码的输入方案。

什么意思呢?前面我们介绍了,双拼输入一个汉字时,只需要敲击两下键盘分别输入声母和韵母,但依然没有解决全拼重码率高的问题。我们可以对其稍加改造,每个汉字,像五笔那样输入四个字符:前两个代表声母和韵母,后两个与字的字形有关。以比较流行的「小鹤双形」输入方案来举例,如果我们想输入「鲸」这个字,声母在本来的键位 J 上,韵母 ing 在 K 键上。后两个码,则是拆出来的第一个字根 + 最后一个字根,即「鱼」和「小」,分别在 A 键位和 X 键位上。这样,只需要输入 JKAX,就能唯一确定到「鲸」这个汉字。

小鹤双形的音码布局与形码布局

总结来说,如果你想追求极致的输入效率,拥有最少的击键时间+选词时间,那么可选的两种方案,一个是五笔输入法,另一种则是双拼加形输入法。而考虑到学习门槛,你完全可以从先全拼过渡到双拼,再由双拼逐渐掌握双拼加形。当然,如果你有信心,也可以直接一步到位尝试学习五笔。

一切输入法最后都是肌肉记忆

在少数派的主站点上,有一篇《选择输入法的哲学:兼论双拼的优缺点》的文章,里面的观点是倾向于双拼是优于五笔的,先不说这个结论是否武断,至少我对于其核心论据有着不同的想法。在文章中有一处核心观点如下:

录入文字的过程可以简单分为两个环节:

  1. 大脑将思考的内容转化为可以通过键盘录入的内容(比如字形、字音);
  2. 通过键盘将字形或字音录入电脑并组合为最终文字。

在我看来,这并不是任何一种输入法熟练掌握者真正输入的过程。评论中有一位读者(@我是咂咂灰)的留言,也同样指出了这一点:

真正长时间用五笔的人,打字根本不需要想拆字,而且很多人给一个生僻字的时候,根本就忘了怎么打,打五笔打到熟练的程度,完全靠的就是手上的肌肉记忆,想到什么就出什么字,根本就没有拆字转换的环节 [……]

的确,我们在打字时,并不会真的去将内容解析成字音或者字形。

什么意思呢?我举一个全拼输入法的例子,「当我想输入这句话时」,你的大脑并不用将其先处理成 dangwoxiangshuruzhejuhua 时,然后去按对应的按键,而是你的手指好像不由自主地已经知道这句话对应敲击哪几个键一样。

当我用五笔来输入「当我想输入这句话时」,其对应的键位是「iv q shn lwty p qkd ytd jf 」,这时候在我的脑中,并不需要先将逐个汉字拆成「小彐木目心车人一月刂文辶勹口讠丿古日寸」,甚至,如果我手边没有键盘,你问我「当」对应哪几个按键时,我可能要反应很久,才能告诉你答案是 iv。在实际输入时,手指知道它们该敲击哪里,尽管我都不知道这个汉字对应的码位是什么。

没错,一切输入法最后都是肌肉记忆

从这个角度来看,输入效率的提升,其实是一种典型的用空间换时间的策略,即花费(肌肉记忆)空间来换取(输入)时间。怎么理解这句话呢?我们从一种稍加简化,但不失核心要点的视角来看的话:

  1. 全拼:拼音一共有 411 种发音组合,当你使用全拼输入方式时,你的肌肉记忆的最小单元其实是 26 个字母。
  2. 双拼:411 种发音组合没有变,但是,这时候你的肌肉记忆的最小单元增加了,因为韵母和键位的对应关系,是需要单独记忆的,这时候你的手指,记住的是 23 个声母 + 35 个韵母的键位。
  3. 五笔:肌肉记忆的最小单元是 130 多个基本字根。

你可以发现,在使用实体键盘打字时,我们一共会利用十根手指,除去敲击空格键的两根大拇指后还剩余八根手指。这八根手指承担的肌肉记忆越多(全拼 26 vs. 双拼 58 vs. 五笔 130),输入效率也就越高。

总结一下本文的核心观点:

  • 对于输入效率,任何微小的提升都是有巨大的意义的;
  • 如果你想追求极致的输入效率,可以尝试双拼加形或五笔,否则,现在的全拼输入法也已经足够好用了;
  • 考虑学习曲线的话,可以先从双拼入手,再挑战双拼加形。十分有信心的,可以直接试试学习五笔;

当然,这篇文章中并没有涉及虚拟键盘的讨论。毕竟,在手机这样的屏幕尺寸上,我们基本只有两个大拇指能用于输入,结合文末的肌肉记忆理论,两根手指实在很难有出彩的输入效率。不过,在虚拟键盘上,的确也涌现了一些有趣的输入方式,像滑行输入法,你仔细思考一下,其实也是从减少「击键时间」这个角度而设计的。

最后,如果有足够多的人(应该没有)对五笔的入门和学习感兴趣,下次有机会我也可以专门再写一篇文章来探讨这个话题。?[/rihide]  

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容