要准确地统计字数,可逐一将字符串转换为ASCII码,依据其值判断是为中文字符还是英文字符。0——127之间的为大小写字母及数字、半角标点符号、回车、换行等,中文字符的ASCII值则不在0——127之列了。这样,纯汉字的字数统计是很容易的,倒是英文的统计复杂,因为英文统计应以单词为单位,而要判断是否为单词并不是简单的事。我们可以这么处理:如果被检测的字符为大小写字母,则判断其后面的字符是否为一个单词的标志(如空格、标点符号、回车符等),如是,则判断为一个单词。
以下代码能较准确地统计出TextBox控件中的中、英文字数和数字字符数,并将全部字节数(含各种控制符如回车等)也统计出来。适用于中英文编排环境。
'窗体级声明
DimcAsLong,e_wordAsLong'中英文字数
DimNumAsLong,sAsLong'数字及全部字符数
'统计——
PrivateSubCommand1_Click()
DimStrAsString'总字符
DimkAsLong'计数器
DimtmpStrAsString'逐一检测的字符
c=0:e_word=0:Num=0:s=0'清空变量
Str=Text1.Text&""'加一空格便于意外时计算最后一个字符
Fork=1ToLen(Str)-1
tmpStr=Mid$(Str,k,1)
IfAsc(tmpStr)>=65AndAsc(tmpStr)<=90Then'小写字母
IfAsc(Mid$(Str,k 1,1))<=64Thene_word=e_word 1
IfAsc(Mid$(Str,k 1,1))>90AndAsc(Mid$(Str,k 1,1))<97Thene_word=e_word 1
IfAsc(Mid$(Str,k 1,1))>122Thene_word=e_word 1
IfAsc(Mid$(Str,k 1,1))=39OrAsc(Mid$(Str,k 1,1))=45Thene_word=e_word-1'是符号'或-时
ElseIfAsc(tmpStr)>=97AndAsc(tmpStr)<=122Then'大写字母
IfAsc(Mid$(Str,k 1,1))<65Thene_word=e_word 1
IfAsc(Mid$(Str,k 1,1))>90AndAsc(Mid$(Str,k 1,1))<97Thene_word=e_word 1
IfAsc(Mid$(Str,k 1,1))>122Thene_word=e_word 1
IfAsc(Mid$(Str,k 1,1))=39OrAsc(Mid$(Str,k 1,1))=45Thene_word=e_word-1'是符号'或-时
ElseIfAsc(tmpStr)>=48AndAsc(tmpStr)<=57Then'阿拉伯数字数字
IfAsc(Mid$(Str,k 1,1))<48OrAsc(Mid$(Str,k 1,1))>57ThenNum=Num 1
ElseIfAsc(tmpStr)>127OrAsc(tmpStr)<0Then'中文字符
c=c 1
EndIf
Next
s=LenB(StrConv(Text1.Text,vbFromUnicode))'全部字符
MsgBox"本文共有:"&vbCrLf&vbCrLf&"汉字字数:"&c&_
"个(含全角标点)"&vbCrLf&"英文单词:"&e_word&"个(不含半角标点)"&vbCrLf&_
"数字:"&Num&"个"&vbCrLf&"全部字节:"&s&"个",vbInformation,"字数统计"
EndSub->