IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> C++知识库 -> C++ 读取 UTF-16 LE 格式的文件 -> 正文阅读

[C++知识库]C++ 读取 UTF-16 LE 格式的文件

今天遇到的问题值得记录。

使用C++读取UTF-16 LE ,也就是宽字符集。按正常的读取

std::ifstream file(fileName.c_str());

打印出的是乱码。

从网上找了好久,C++并没有像python那样一个函数就搞定的方法。只能一步一步来。

思路:

使用C语言函数来打开文件,原因:找了半天C++也没有对文件操作指定编码格式的函数,只有C语言有。

FILE* fp;
auto err = _wfopen_s(&fp,szFile.c_str(), L"r, ccs=UTF-16LE");

就是这个,推荐只用这个函数,因为别的函数基本上都不安全,使用VS2015编译提示出错,或者弃用了。

打开文件以后,然后一行一行读取文件即可,需要注意的就是,读到数据格式是wchar_t的,如果想要存到string需要各式转换,这里引用前人写好的函数,不造轮子了。

wchar_t*转换string_weixin_30764771的博客-CSDN博客

引用这位博主的文章。

转换好就可以正常使用了,由于我的文件是csv文件,一个用于多语言的文件,第一列是ID,第二列是英文,第三列是中文。

我的需求是把ID 和英文存到map中,ID位key,英文为value。要是第三列中文为空跳过。

一下为demo

#include <iostream>
#include <vector>
#include <algorithm>
#include <fstream>
#include <string>
#include <atltrace.h>   
#include <sstream>
#include <map>

// wchar_t to string
void Wchar_tToString(std::string& szDst, wchar_t *wchar)
{
	wchar_t * wText = wchar;
	DWORD dwNum = WideCharToMultiByte(CP_OEMCP, NULL, wText, -1, NULL, 0, NULL, FALSE);// WideCharToMultiByte的运用
	char *psText; // psText为char*的临时数组,作为赋值给std::string的中间变量
	psText = new char[dwNum];
	WideCharToMultiByte(CP_OEMCP, NULL, wText, -1, psText, dwNum, NULL, FALSE);// WideCharToMultiByte的再次运用
	szDst = psText;// std::string赋值
	delete[]psText;// psText的清除
}

std::map<int, std::string> ReadCSVUTF16LE(const std::wstring& fileName)
{
	FILE* fp;
	std::map<int, std::string>MultiMap;
	auto err = _wfopen_s(&fp, fileName.c_str(), L"r, ccs=UTF-16LE");
	wchar_t str[1024] = { 0 };
	while (fgetws(str, 1024, fp) != NULL)
	{
		std::string value;
		std::vector <std::string> arrValue;
		Wchar_tToString(value, str);
		value.erase(0, value.find_first_not_of("\n\r"));
		value.erase(value.find_last_not_of("\n\r") + 1);
		if (value.empty())//skip empty line
		{
			continue;
		}
		std::stringstream ss(value);
		while (std::getline(ss, value, '\t'))
		{
			arrValue.push_back(value);
		}
		if (arrValue.size() < 2)
		{
			continue;
		}
		MultiMap.insert(std::pair<int, std::string>(std::stoi(arrValue[0]), arrValue[1]));
	}
	fclose(fp);
	return MultiMap;
}
int main()
{
	std::wstring szFile = L"McuUser.csv";
	std::map<int, std::string> MultiMap = ReadCSVUTF16LE(szFile);

	for (auto &it : MultiMap)
	{
		std::cout << "it.first = " << it.first << " it.second = " << it.second << std::endl;		
	}	
	system("pause");
	return 0;
}

  C++知识库 最新文章
【C++】友元、嵌套类、异常、RTTI、类型转换
通讯录的思路与实现(C语言)
C++PrimerPlus 第七章 函数-C++的编程模块(
Problem C: 算法9-9~9-12:平衡二叉树的基本
MSVC C++ UTF-8编程
C++进阶 多态原理
简单string类c++实现
我的年度总结
【C语言】以深厚地基筑伟岸高楼-基础篇(六
c语言常见错误合集
上一篇文章      下一篇文章      查看所有文章
加:2021-11-17 12:34:54  更:2021-11-17 12:37:21 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 6:29:06-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码