Всем привет!
Я занимаюсь лингвистическим анализатором, и сейчас тестирую несколько библиотек занимающихся разбиением фразы на слова
было: “阿里巴巴收购了中国万网。你可以给客服打电话咨询一下!”
стало “阿里巴巴, 收购, 了, 中国, 万网, 你, 可以, 给, 客服, 打电话, 咨询, 一下”
Я поигрался вот с этим (это советуют многие китайские программисты). А еще с Lucene Smart Chinese (это очень любят на западе).
Но вот ни один из советов среди программистов не привел к хорошему средству. И на удивление БКРС оказался крут в этом плане.
Уважаемые разработчики, подскажите, пожалуйста, какой библиотекой пользуетесь вы?
Я занимаюсь лингвистическим анализатором, и сейчас тестирую несколько библиотек занимающихся разбиением фразы на слова
было: “阿里巴巴收购了中国万网。你可以给客服打电话咨询一下!”
стало “阿里巴巴, 收购, 了, 中国, 万网, 你, 可以, 给, 客服, 打电话, 咨询, 一下”
Я поигрался вот с этим (это советуют многие китайские программисты). А еще с Lucene Smart Chinese (это очень любят на западе).
Но вот ни один из советов среди программистов не привел к хорошему средству. И на удивление БКРС оказался крут в этом плане.
Уважаемые разработчики, подскажите, пожалуйста, какой библиотекой пользуетесь вы?