使用cjieba(结巴分词库)实现php扩展中文分词-支持php5, php7

时间:2020-8-5 作者:admin

编译安装

git clone https://github.com/jonnywang/jz.git  (php7)
git clone https://github.com/jonnywang/phpjieba.git (php5)
cd jz/cjieba
make
cd ..
phpize
./configure --enable-jieba
make
make install
配置php.ini
extension=jz.so 
jz.enable_jieba=1
jz.dict_path=/Users/xingqiba/data/softs/jz/cjieba/dict    #指向jz库dict目录

使用

<?php

$result = jz_jieba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造');
print_r($result);

$result = jz_jieba('小明硕士毕业于中国科学院计算所,后在日本京都大学深造', true, 6);
print_r($result);

效果

Array
(
    [0] => 小明
    [1] => 硕士
    [2] => 毕业
    [3] => 于
    [4] => 中国
    [5] => 科学
    [6] => 学院
    [7] => 科学院
    [8] => 中国科学院
    [9] => 计算
    [10] => 计算所
    [11] => ,
    [12] => 后
    [13] => 在
    [14] => 日本
    [15] => 京都
    [16] => 大学
    [17] => 日本京都大学
    [18] => 深造
)

Array
(
    [0] => 计算所
    [1] => 小明
    [2] => 京都大学
    [3] => 深造
    [4] => 硕士
    [5] => 中国科学院
)

声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。