请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

正在回答 回答被采纳积分+3

1回答

liuyubobobo 2019-09-29 03:09:34

这个分词代码也有 C++ 版本,如下:https://github.com/liuyubobobo/Play-with-Algorithms/blob/master/05-Binary-Search-Tree/Course%20Code%20(C%2B%2B)/04-Binary-Search-Tree-Search/FileOps.h


基本原理其实就是先定位第一个字母,然后定位这个字符以后第一个非字母的位置,之后,这个字母和非字母之间就是一个单词;

然后,再定位这个非字母后的第一个字母,之后定位这个字母后的第一个非字母,然后,这个字母和非字母之间就是一个单词;

以此类推。


start定位了每次字母的位置;i定位了对于一个 start,之后第一个非字母的位置。


继续加油!:)

2 回复 有任何疑惑可以回复我~
  • 那要是中文呢  中文 就不好分了把  因为 好多词是连在一起的
    回复 有任何疑惑可以回复我~ 2020-05-31 00:37:35
  • 中文不能靠空格分词。实际上,对于中文来说,什么是“词”,定义也是模糊的。所以中文的分词是一个人工智能问题,通常在自然语言领域处理。如果有兴趣可以查找相关资料。
    回复 有任何疑惑可以回复我~ 2020-05-31 00:48:59
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信