当前位置:  编程技术>php

php获取中文拼音首字母类和函数分享

    来源: 互联网  发布时间:2014-08-26

    本文导语:  一、公司同事整理的类,挺实用的.相信拿出来分享下他不会介意的O(∩_∩)O.不过如果首字母是数字或英文会有些问题. 代码如下:/** * Helper_Spell 汉字拼音首字母工具类 * * @category Helper * @package  Helper_Spell * @author   Lancer  * @ver...

一、公司同事整理的类,挺实用的.相信拿出来分享下他不会介意的O(∩_∩)O.不过如果首字母是数字或英文会有些问题.

代码如下:

/**
 * Helper_Spell 汉字拼音首字母工具类
 *
 * @category Helper
 * @package  Helper_Spell
 * @author   Lancer
 * @version  1.0
 * @see      Translation_Big2gb
 */

class Helper_Spell {
/**
 * $_pinyins
 * @var array
 * @access private
 */
private $_pinyins = array(
    176161 => 'A',
    176197 => 'B',
    178193 => 'C',
    180238 => 'D',
    182234 => 'E',
    183162 => 'F',
    184193 => 'G',
    185254 => 'H',
    187247 => 'J',
    191166 => 'K',
    192172 => 'L',
    194232 => 'M',
    196195 => 'N',
    197182 => 'O',
    197190 => 'P',
    198218 => 'Q',
    200187 => 'R',
    200246 => 'S',
    203250 => 'T',
    205218 => 'W',
    206244 => 'X',
    209185 => 'Y',
    212209 => 'Z',
    215249 => 'Z',
);


/**
 * $_charset
 * @var string
 * @access private
 */
private $_charset = null;

/**
 * __construct 构造函数, 指定需要的编码 default: utf-8 支持utf-8, gb2312
 *
 * @param unknown_type $charset
 */
public function __construct( $charset = 'utf-8' ) {
    $this->_charset = $charset;
}

/**
 * getInitialsFirst 返回首个汉字的拼音
 *
 * @access public
 * @static
 * @param  string $str
 * @return string
 * @example Helper_Spell::getInitialsFirst('我的爱'); => w
 */
public static function getInitialsFirst( $str, $charset = 'utf-8' ) {
    $chars = array(
        'A','B','C','D','E','F',
        'G','H','I','J','K','L',
        'M','N','O','P','Q','R',
        'S','T','U','V','W','X',
        'Y','Z');


    $string = self::getInitials( $str );
    $length = strlen($string);


    for($i=0; $i < $length; $i++) {
        if ( in_array( $string{$i}, $chars ) ) {
            return $string{$i};
        }
    }
    return '*';
}


/**
 * getInitials 返回拼音组合
 *
 * @access public
 * @static
 * @param  string $str
 * @return string
 * @example Helper_Spell::getInitials('我的爱'); => wda
 */
public static function getInitials( $str, $charset = 'utf-8' ) {
    $instance = new Helper_Spell( $charset );
    return $instance->_getInitials( $str );
}


/**
 * _getInitials 获取中文字串的拼音首字符
 *              注:英文的字串:不变返回(包括数字)    eg .abc123 => abc123
 *                  中文字符串:返回拼音首字符        eg. 王小明 => WXM
 *                  中英混合串: 返回拼音首字符和英文  eg. 我i我j => WIWJ
 *
 * @access private
 * @param  string $str
 * @return string
 */
private function _getInitials( $str, $translation=TRUE ){
    if ( empty($str) ) return '';
    if ( $this->_isAscii($str[0]) && $this->_isAsciis( $str ))
        return $str;

    if ( $translation )
        $str = Translation_Big2gb::big2gb( $str );

    $result = array();
    if ( $this->_charset == 'utf-8' ){
        //IGNORE很重要,加上这个就可以是ICONV()函数忽略错误,继续执行
        $str = iconv( 'utf-8', 'gbk//IGNORE', $str );
    }
    $words = $this->_cutWord( $str );


    foreach ( $words AS $word ) {          
        if ( $this->_isAscii($word) ) {//非中文
            $result[] = $word;
            continue;
        }
        $code = ( ord(substr($word,0,1)) ) * 1000 + (ord(substr($word,1,1)));
        //获取拼音首字母A--Z


        if ( ($i = $this->_search($code)) != -1 ){
            $result[] = $this->_pinyins[$i];
        }
    }
    return strtoupper(implode('', $result));
}


/**
 * _msubstr 获取中文字符串
 *
 * @access private
 * @param string $str
 * @param int    $start
 * @param int    $len
 * @return string
 */
private function _msubstr ($str, $start, $len) {
    $start  = $start * 2;
    $len    = $len * 2;
    $strlen = strlen($str);
    $result = '';
    for ( $i = 0; $i < $strlen; $i++ ) {
        if ( $i >= $start && $i < ($start + $len) ) {
            if ( ord(substr($str, $i, 1)) > 129 ) $result .= substr($str, $i, 2);
            else $result .= substr($str, $i, 1);
        }
        if ( ord(substr($str, $i, 1)) > 129 ) $i++;
    }
    return $result;
}


/**
 * _cutWord  字符串切分为数组 (汉字或者一个字符为单位)
 *
 * @access private
 * @param string $str
 * @return array
 */
private function _cutWord( $str ) {
    $words = array();
    while ( $str != "" ) {
        if ( $this->_isAscii($str) ) {//非中文
            $words[] = $str[0];
            $str = substr( $str, strlen($str[0]) );
        } else {
            $word = $this->_msubstr( $str, 0, 1 );
            $words[] = $word;
            $str = substr( $str,  strlen($word) );
        }
     }
     return $words;
}


/**
 * _isAscii 判断字符是否是ascii字符
 *
 * @access private
 * @param  string $char
 * @return bool
 */
private function _isAscii( $char ) {
    return ( ord( substr($char,0,1) ) < 160 );
}

 

/**
 * _isAsciis 判断字符串前3个字符是否是ascii字符
 *
 * @access private
 * @param  string $str
 * @return bool
 */
private function _isAsciis( $str ) {
    $len = strlen($str) >= 3 ? 3: 2;
    $chars = array();
    for( $i = 1; $i < $len -1; $i++ ){
        $chars[] = $this->_isAscii( $str[$i] ) ? 'yes':'no';
    }
    $result = array_count_values( $chars );
    if ( empty($result['no']) ){
        return true;
    }
    return false;
}



/**
 * _getChar 通过ASC码返回字母或者数字
 *
 * @access private
 * @param  string $ascii
 * @return string
 */
private function _getChar( $ascii ){
    if ( $ascii >= 48 && $ascii =65 && $ascii=97 && $ascii_pinyins);


    $lower = 0;
    $upper = sizeof($data)-1;


    // 排除非一级汉字
    if ($code < $data[0] || $code > $data[23]) return -1;


    for (;;) {        
        if ( $lower > $upper ){            
            return $data[$lower-1];
        }
        $middle = (int) round(($lower + $upper) / 2);
        if ( !isset($data[$middle]) ) {         
            return -1;
        }


        if ( $data[$middle] < $code ){
            $lower = (int)$middle + 1;
        } else if ( $data[$middle] == $code ) {          
            return $data[$middle];
        } else {
            $upper = (int)$middle - 1;
        }
    }// end for
}

}

二、用来得到中文的首字母

这个是将中文转换为拼音的类:charset

代码如下:


    
 
 

您可能感兴趣的文章:

  • php判断字符串是否全是中文或含有中文
  • 中文分词PHP扩展 MFSOU
  • php网页标题中文乱码如何解决
  • 解决php json_encode中文转码、乱码问题
  • php网页标题中文乱码的有效解决方法
  • php中文字符串截取函数示例
  • PHP中文套件 PHPnow
  • php+正则将字符串中的字母数字和中文分割
  • php导入csv文件中文乱码的解决方法
  • PHP中文分词扩展 robbe
  • PHP中file_exists函数不支持中文名的解决方法
  • 支持中文和其他编码的php截取字符串函数分享(截取中文字符串)
  • php截取中文字符串(无乱码)方法
  • 解决php csv文件导入mysql中文乱码
  • PHP解决URL中文GBK乱码问题的两种方法
  • 解决php接收shell返回的结果中文乱码问题
  • php mb_substr()函数截取中文字符串应用示例
  • 我在安装LINUX 9简体中文版时,漏装了一个PHP-MYSQL的模块,那我现在该如何加装?
  • php中文乱码怎么办如何让浏览器自动识别utf-8
  • php中file_exists函数不支持中文名怎么办?
  • PHP的substr() 函数用法
  • php构造函数与析构函数
  • php中检测变量是否是一个对象的is_object函数介绍及用法举例
  • php构造函数与析构函数初探
  • php session_id()函数介绍及代码实例
  • PHP中的Pack()函数,Java有哪个函数与之对应???
  • php中session_id()函数详细介绍,会话id生成过程及session id长度
  • php构造函数与析构函数 php内存管理函数
  • php将html特殊字符转换成html字符串的函数:htmlspecialchars()介绍及代码举例
  • php数组函数之array_combine() 数组合并函数
  • php使用socket_bind()函数绑定IP地址
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • PHP汉字拼音转换、公历农历转换的实例详解
  • php根据ip调用新浪api获取城市名转拼音
  • php汉字转拼音的示例
  • PHP中文转拼音工具 Pinyin
  • php汉字转换成拼音的函数
  • php mysql中utf8编码汉字转换成拼音
  • 简单的php中文转拼音的实现代码
  • php汉字转拼音代码
  • PHP实现的汉字拼音转换和公历农历转换类及使用示例
  • 支持生僻字且自动识别utf-8编码的php汉字转拼音类
  • 修改配置真正解决php文件上传大小限制问题(nginx+php)
  • IIS7配置PHP图解(IIS7+PHP_5.2.17/PHP_5.3.5)
  • PHP 5.4.19 和 PHP 5.5.3 发布及下载地址
  • php输入流php://input使用示例(php发送图片流到服务器)
  • 修改配置真正解决php文件上传大小限制问题(apache+php)
  • PHP转换器 HipHop for PHP
  • PHP去除html标签,php标记及css样式代码参考
  • PHP 框架 Pop php
  • PHP 'ext/soap/php_xml.c'不完整修复存在多个任意文件泄露漏洞
  • PHP的JavaScript框架 PHP.JS
  • php通过socket_bind()设置IP地址代码示例
  • php服务器探针显示php服务器信息
  • php安装完成后如何添加mysql扩展
  • PHP缓存加速器 Alternative PHP Cache (APC)
  • PHP介绍及学习网站推荐
  • PHP源文件加密工具 PHP Screw
  • php中操作memcache的类及成员列表及php下如何连接memched服务器
  • PHP自动化测试 PHP-QAT
  • php中内置的mysql数据库连接驱动mysqlnd简介及mysqlnd的配置安装方式
  • PHP 的 HTTP 客户端库 PHP Buzz
  • php将标准字符串格式时间转换成unix时间戳_strtotime




  • 特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3