天使漫步IT工作室天使漫步IT工作室

python实现汉字简繁体相互转换-hanziconv-0.2.1


Warning: count(): Parameter must be an array or an object that implements Countable in /www/wwwroot/u11u.com/usr/themes/wq/functions.php on line 110

Warning: count(): Parameter must be an array or an object that implements Countable in /www/wwwroot/u11u.com/usr/themes/wq/functions.php on line 116

一、简介

这是一款可以中文汉字简繁体转换的python库,它主要由两个部分组成:

  • hanzi-convert: 命令行工具
  • hanziconv: python 转换库

二、安装

$ pip install hanziconv

如果提示没有权限则使用sudo前缀,另外可以加-i参数添加国内的安装来源来加快速度,pip源列表参考:设置国内pip源,加速pip更新速度

三、使用

  • 1、命令行的不再介绍,可以参考文档。或者敲入hanzi-convert --help来获得更多信息。
  • 2、hanziconv API 支持python 2.x 和 3.x版本。

四、hanziconv API的使用

  • 汉字转换API示例:
>>> from hanziconv import HanziConv
>>> print(HanziConv.toSimplified('繁簡轉換器'))
繁简转换器
>>> print(HanziConv.toTraditional('繁简转换器'))
繁簡轉換器
>>> print(HanziConv.toSimplified(u'繁簡轉換器'))
繁简转换器
>>> print(HanziConv.toTraditional(u'繁简转换器'))
繁簡轉換器
>>> print(HanziConv.toSimplified(u'mix English and Chinese. 繁簡轉換器')
mix English and Chinese. 繁简转换器
>>> print(HanziConv.toTraditional(u'mix English and Chinese. 繁简转换器'))
mix English and Chinese. 繁簡轉換器
>>> print(HanziConv.toSimplified('mix English and Chinese. 繁簡轉換器'))
mix English and Chinese. 繁简转换器
>>> print(HanziConv.toTraditional('mix English and Chinese. 繁简转换器'))
mix English and Chinese. 繁簡轉換器

说明:上面是在控制台终端输入python后出现>>>的运行结果。

除此以外,hanziconv 还提供API来进行简繁体的比较,如果你直接比较两个相同意思的简繁体字符串u'繁簡轉換器' == u'繁简转换器'得到的结果是False,但是使用hanziconv API却能够得到正确的结果。

  • 比较字符串 API示例:
>>> from hanziconv import HanziConv
>>> u'繁簡轉換器' ==  u'繁简转换器'
False
>>> HanziConv.same(u'繁簡轉換器', u'繁简转换器')
True
>>> str1 = 'mix English and Chinese. 繁簡轉換器'
>>> str2 = 'mix English and Chinese. 繁简转换器'
>>> str3 = 'mix Chinese and English. 繁简转换器'
>>> str4 = u'mix English and Chinese. 繁簡轉換器'
>>> HanziConv.same(str1, str2)
True
>>> HanziConv.same(str2, str3)
False
>>> HanziConv.same(str1, str4)
True

更多信息请参考:hanziconv 0.2.1-document

B117919A-20E4-43F0-9AB0-1378A01D4046.png

本站原创,欢迎转载,转载敬请标明出处:天使漫步IT工作室 » python实现汉字简繁体相互转换-hanziconv-0.2.1
添加新评论


Warning: Use of undefined constant php - assumed 'php' (this will throw an Error in a future version of PHP) in /www/wwwroot/u11u.com/usr/themes/wq/comments.php on line 38