我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:双彩网 > 语义分析 >

汉语语义分析软件 1怎样处理一篇文章中相同的词?

归档日期:06-30       文本归类:语义分析      文章编辑:爱尚语录

  问题:怎样发现并处理一篇文章中相同的词?答:1 只要不是汉字字符的,统统断开。标点符号隔开去掉,然后再对单独的句子或词组按照下面的方法进行确认1 连续汉字数字、连续阿拉伯数字放在一起、连续英文字母放在一起、“的、但、并、也、被、不、已、虽、仍、为、经”另外独立1 1 先从第一句的第一个字和第二个字开始找起, 看是否有相同的组合,如果没有,那么就从第二个字开始找,如果有,就组合前3个字,一直找到前15个,只要能找到,就往下找,如果找不到,就取找到的最大值,把这个词提出来,保存在一个数组中,把整个文章中重复的内容全部去掉,然后从这个词后面一个字开始,继续往下找,还按照上面的方法,这样就可以找遍整个文章,把整个文章中重复的内容全部去掉,并只留下最后缩减的一些词,以及没有重复的内容,这些重复的内容中,再去掉一些“的、地、得”等词,进行进一步的分析。如何区分一个String串中的字母数字和汉字? 编程随机从字库中抽取10个汉字,任意组合,激发灵感。。。怎样把汉字全部翻译成拼音?foxpro 下怎样进行搜索和替换?通用规范汉字表现代汉语语义词典

本文链接:http://furymagazine.com/yuyifenxi/130.html