采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
这个分词代码也有 C++ 版本,如下:https://github.com/liuyubobobo/Play-with-Algorithms/blob/master/05-Binary-Search-Tree/Course%20Code%20(C%2B%2B)/04-Binary-Search-Tree-Search/FileOps.h
基本原理其实就是先定位第一个字母,然后定位这个字符以后第一个非字母的位置,之后,这个字母和非字母之间就是一个单词;
然后,再定位这个非字母后的第一个字母,之后定位这个字母后的第一个非字母,然后,这个字母和非字母之间就是一个单词;
以此类推。
start定位了每次字母的位置;i定位了对于一个 start,之后第一个非字母的位置。
继续加油!:)
那要是中文呢 中文 就不好分了把 因为 好多词是连在一起的
中文不能靠空格分词。实际上,对于中文来说,什么是“词”,定义也是模糊的。所以中文的分词是一个人工智能问题,通常在自然语言领域处理。如果有兴趣可以查找相关资料。
登录后可查看更多问答,登录/注册
课程专为:短时间内应对面试、升职测评等艰巨任务打造
8.8k 21
5.7k 3
4.9k 5
1.4k 18