【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
作为一个非专业程序员与C++爱好者,我主要用C++写点小工具...
为什么我遇到的问题是,我的项目根本就坚持不到屎山。 因为在...
养草龟,非常好养。 我前年秋天买了2个幼苗,才10克重,现在...
用内存虚拟化方案就可以了。 因为 Obsidian 对于 ....
。 。 。 记不太住。 感觉九几年以后冒出来的明星,有好多...
纯从消费者角度聊。 我不再相信 ARM 比 x86 有固有的...