CharacterConvert.cpp 9.5 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411
  1. /************************************************************************/
  2. /*
  3. 文件名称: CharacterConvert.cpp
  4. 文件标识:
  5. 内容摘要: 转换各种字符编码;
  6. 其它说明: 无
  7. 当前版本: V 0.1
  8. 作 者: Jeff
  9. 完成日期: 2015年04月05日
  10. 修改记录1:
  11. 修改日期:-
  12. 版 本 号:-
  13. 修 改 人:-
  14. 修改内容:-
  15. */
  16. /************************************************************************/
  17. //////////////////////////////////////////////////////////////////////////
  18. #include "stdafx.h"
  19. #include "CharacterConvert.h"
  20. //////////////////////////////////////////////////////////////////////////
  21. /************************************************************************/
  22. /*
  23. 函数: utf82unicode
  24. 描述: utf8字符串转为unicode字符串;
  25. 参数:
  26. pszutf8 utf8字符串;
  27. 返回: unicode字符串;
  28. 注意: 返回的指针所指向的内存需要释放;
  29. */
  30. /************************************************************************/
  31. WCHAR* utf82unicode(__in const char *pszutf8)
  32. {
  33. int wnSize = MultiByteToWideChar(CP_UTF8, 0, pszutf8, -1, NULL, 0);
  34. if (wnSize == ERROR_NO_UNICODE_TRANSLATION)
  35. {
  36. //throw std::exception("Invalide UTF-8 sequence");
  37. return NULL;
  38. }
  39. if (wnSize == 0)
  40. {
  41. //throw std::exception("Error in conversion");
  42. return NULL;
  43. }
  44. WCHAR *pwResult = new WCHAR[wnSize];
  45. int nConvertSize = MultiByteToWideChar(CP_UTF8, 0, pszutf8, -1, pwResult, wnSize);
  46. if (nConvertSize != wnSize)
  47. {
  48. //throw std::exception("la falla");
  49. if (pwResult)
  50. delete pwResult;
  51. return NULL;
  52. }
  53. return pwResult;
  54. }
  55. /************************************************************************/
  56. /*
  57. 函数: utf82unicode
  58. 描述: utf8字符串转为unicode字符串;
  59. 参数:
  60. pszutf8 utf8字符串;
  61. pszunicode 返回的unicode字符串;
  62. 返回: unicode字符串大小;
  63. */
  64. /************************************************************************/
  65. int utf82unicode(__in const char *pszutf8, __inout WCHAR *pszunicode)
  66. {
  67. int wnSize = MultiByteToWideChar(CP_UTF8, 0, pszutf8, -1, NULL, 0);
  68. if (wnSize == ERROR_NO_UNICODE_TRANSLATION)
  69. {
  70. //throw std::exception("Invalide UTF-8 sequence");
  71. return 0;
  72. }
  73. if (wnSize == 0)
  74. {
  75. //throw std::exception("Error in conversion");
  76. return 0;
  77. }
  78. int nConvertSize = MultiByteToWideChar(CP_UTF8, 0, pszutf8, -1, pszunicode, wnSize);
  79. if (nConvertSize != wnSize)
  80. {
  81. //throw std::exception("la falla");
  82. return 0;
  83. }
  84. return wnSize;
  85. }
  86. /************************************************************************/
  87. /*
  88. 函数: unicode2acsii
  89. 描述: unicode字符串转为acsii字符串;
  90. 参数:
  91. pszunicode unicode字符串;
  92. 返回: acsii字符串;
  93. 注意: 返回的指针所指向的内存需要释放;
  94. */
  95. /************************************************************************/
  96. CHAR* unicode2acsii(__in const WCHAR *pszunicode)
  97. {
  98. int asciisize = WideCharToMultiByte(CP_OEMCP, 0, pszunicode, -1, NULL, 0, NULL, NULL);
  99. if (asciisize == ERROR_NO_UNICODE_TRANSLATION)
  100. {
  101. //throw std::exception("Invalid UTF-8 sequence.");
  102. return NULL;
  103. }
  104. if (asciisize == 0)
  105. {
  106. //throw std::exception("Error in conversion.");
  107. return NULL;
  108. }
  109. CHAR *pAscii = new CHAR[asciisize];
  110. int convresult = WideCharToMultiByte(CP_OEMCP, 0, pszunicode, -1, pAscii, asciisize, NULL, NULL);
  111. if (convresult != asciisize)
  112. {
  113. //throw std::exception("La falla!");
  114. if (pAscii) delete pAscii;
  115. return NULL;
  116. }
  117. return pAscii;
  118. }
  119. /************************************************************************/
  120. /*
  121. 函数: unicode2acsii
  122. 描述: unicode字符串转为acsii字符串;
  123. 参数:
  124. pszunicode unicode字符串;
  125. pszacsii 返回的acsii字符串;
  126. 返回: acsii字符串大小;
  127. */
  128. /************************************************************************/
  129. int unicode2acsii(__in const WCHAR *pszunicode, __inout CHAR *pszacsii)
  130. {
  131. int asciisize = WideCharToMultiByte(CP_OEMCP, 0, pszunicode, -1, NULL, 0, NULL, NULL);
  132. if (asciisize == ERROR_NO_UNICODE_TRANSLATION)
  133. {
  134. //throw std::exception("Invalid UTF-8 sequence.");
  135. return 0;
  136. }
  137. if (asciisize == 0)
  138. {
  139. //throw std::exception("Error in conversion.");
  140. return 0;
  141. }
  142. int convresult = WideCharToMultiByte(CP_OEMCP, 0, pszunicode, -1, pszacsii, asciisize, NULL, NULL);
  143. if (convresult != asciisize)
  144. {
  145. //throw std::exception("La falla!");
  146. return 0;
  147. }
  148. return asciisize;
  149. }
  150. /************************************************************************/
  151. /*
  152. 函数: utf82ascii
  153. 描述: 将utf8字符串转为ascii字符串;
  154. 参数:
  155. pszutf8 utf8字符串;
  156. 返回: ascii字符串;
  157. 注意: 返回的指针需要手动释放所指内存;
  158. */
  159. /************************************************************************/
  160. CHAR* utf82ascii(const CHAR *pszutf8)
  161. {
  162. // 先把 utf8 转为 unicode ;
  163. WCHAR *pwstr = utf82unicode(pszutf8);
  164. // 最后把 unicode 转为 ascii ;
  165. CHAR *pacsii = NULL;
  166. if (pwstr)
  167. pacsii = unicode2acsii(pwstr);
  168. if (pwstr)
  169. delete pwstr;
  170. return pacsii;
  171. }
  172. /************************************************************************/
  173. /*
  174. 函数: utf82ascii
  175. 描述: 将utf8字符串转为ascii字符串;
  176. 参数:
  177. pszutf8 utf8字符串;
  178. 返回: ascii字符串;
  179. 注意: 返回的指针需要手动释放所指内存;
  180. */
  181. /************************************************************************/
  182. int utf82ascii(__in const CHAR *pszutf8, __inout CHAR* pszacsii)
  183. {
  184. // 先把 utf8 转为 unicode ;
  185. WCHAR *pwstr = utf82unicode(pszutf8);
  186. // 最后把 unicode 转为 ascii ;
  187. int nascii = 0;
  188. if (pwstr)
  189. nascii = unicode2acsii(pwstr, pszacsii);
  190. if (pwstr)
  191. delete pwstr;
  192. return nascii;
  193. }
  194. /************************************************************************/
  195. /*
  196. 函数: unicode2uft8
  197. 描述: 将unicode字符串转为utf8字符串;
  198. 参数:
  199. pszunicode unicode字符串;
  200. 返回: utf8字符串;
  201. 注意: 返回的指针需要手动释放所指内存;
  202. */
  203. /************************************************************************/
  204. CHAR* unicode2uft8(__in const WCHAR *pszunicode)
  205. {
  206. int utf8size = WideCharToMultiByte(CP_UTF8, 0, pszunicode, -1, NULL, 0, NULL, NULL);
  207. if (utf8size == 0)
  208. {
  209. //throw std::exception("Error in conversion.");
  210. return NULL;
  211. }
  212. CHAR* putf8 = new CHAR[utf8size];
  213. int convresult = WideCharToMultiByte(CP_UTF8, 0, pszunicode, -1, putf8, utf8size, NULL, NULL);
  214. if (convresult != utf8size)
  215. {
  216. //throw std::exception("La falla!");
  217. if (putf8)delete putf8;
  218. return NULL;
  219. }
  220. return putf8;
  221. }
  222. /************************************************************************/
  223. /*
  224. 函数: unicode2uft8
  225. 描述: 将unicode字符串转为utf8字符串;
  226. 参数:
  227. pszunicode unicode字符串;
  228. pszutf8 返回的utf8字符串;
  229. 返回: utf8字符串大小;
  230. */
  231. /************************************************************************/
  232. int unicode2uft8(__in const WCHAR *pszunicode, __inout CHAR* pszutf8)
  233. {
  234. int utf8size = WideCharToMultiByte(CP_UTF8, 0, pszunicode, -1, NULL, 0, NULL, NULL);
  235. if (utf8size == 0)
  236. {
  237. //throw std::exception("Error in conversion.");
  238. return 0;
  239. }
  240. int convresult = WideCharToMultiByte(CP_UTF8, 0, pszunicode, -1, pszutf8, utf8size, NULL, NULL);
  241. if (convresult != utf8size)
  242. {
  243. //throw std::exception("La falla!");
  244. return 0;
  245. }
  246. return utf8size;
  247. }
  248. /************************************************************************/
  249. /*
  250. 函数: ascii2unicode
  251. 描述: 将ascii字符串转为unicode字符串;
  252. 参数:
  253. pszascii ascii字符串;
  254. 返回: unicode字符串;
  255. 注意: 返回的指针需要手动释放其所指的内存;
  256. */
  257. /************************************************************************/
  258. WCHAR* ascii2unicode(__in const CHAR* pszascii)
  259. {
  260. int wSize = MultiByteToWideChar(CP_ACP, 0, pszascii, -1, NULL, 0);
  261. if (wSize == ERROR_NO_UNICODE_TRANSLATION)
  262. {
  263. //throw std::exception("Invalid UTF-8 sequence.");
  264. return NULL;
  265. }
  266. if (wSize == 0)
  267. {
  268. //throw std::exception("Error in conversion.");
  269. return NULL;
  270. }
  271. WCHAR *punicode = new WCHAR[wSize];
  272. int convresult = MultiByteToWideChar(CP_ACP, 0, pszascii, -1, punicode, wSize);
  273. if (convresult != wSize)
  274. {
  275. //throw std::exception("La falla!");
  276. if (punicode) delete punicode;
  277. return NULL;
  278. }
  279. return punicode;
  280. }
  281. /************************************************************************/
  282. /*
  283. 函数: ascii2unicode
  284. 描述: 将ascii字符串转为unicode字符串;
  285. 参数:
  286. pszascii ascii字符串;
  287. 返回: unicode字符串;
  288. 注意: 返回的指针需要手动释放其所指的内存;
  289. */
  290. /************************************************************************/
  291. int ascii2unicode(__in const CHAR* pszascii, __inout WCHAR *pszunicode)
  292. {
  293. int wSize = MultiByteToWideChar(CP_ACP, 0, pszascii, -1, NULL, 0);
  294. if (wSize == ERROR_NO_UNICODE_TRANSLATION)
  295. {
  296. //throw std::exception("Invalid UTF-8 sequence.");
  297. return 0;
  298. }
  299. if (wSize == 0)
  300. {
  301. //throw std::exception("Error in conversion.");
  302. return 0;
  303. }
  304. int convresult = MultiByteToWideChar(CP_ACP, 0, pszascii, -1, pszunicode, wSize);
  305. if (convresult != wSize)
  306. {
  307. //throw std::exception("La falla!");
  308. return 0;
  309. }
  310. return wSize;
  311. }
  312. /************************************************************************/
  313. /*
  314. 函数: ascii2utf8
  315. 描述: 将ascii字符串转为utf8字符串;
  316. 参数:
  317. pszascii ascii字符串;
  318. 返回: uft8字符串;
  319. 注意: 返回的指针需要手动释放其所指的内存;
  320. */
  321. /************************************************************************/
  322. CHAR* ascii2utf8(__in const CHAR* pszascii)
  323. {
  324. // 先把 ascii 转为 unicode ;
  325. WCHAR *pwstr = ascii2unicode(pszascii);
  326. // 最后把 unicode 转为 utf8 ;
  327. CHAR* putf8 = NULL;
  328. if (pwstr)
  329. putf8 = unicode2uft8(pwstr);
  330. if (pwstr)
  331. delete pwstr;
  332. return putf8;
  333. }
  334. /************************************************************************/
  335. /*
  336. 函数: ascii2utf8
  337. 描述: 将ascii字符串转为utf8字符串;
  338. 参数:
  339. pszascii ascii字符串;
  340. 返回: uft8字符串;
  341. 注意: 返回的指针需要手动释放其所指的内存;
  342. */
  343. /************************************************************************/
  344. int ascii2utf8(__in const CHAR* pszascii, __inout CHAR* pszutf8)
  345. {
  346. // 先把 ascii 转为 unicode ;
  347. WCHAR *pwstr = ascii2unicode(pszascii);
  348. // 最后把 unicode 转为 utf8 ;
  349. int nSize = 0;
  350. if (pwstr)
  351. nSize = unicode2uft8(pwstr, pszutf8);
  352. if (pwstr)
  353. delete pwstr;
  354. return nSize;
  355. }