计算机基础二
一、文件
1.什么是文件(计算机语言描述)
文件是操作系统暴露给用户操作硬盘的快捷方式(接口)。
2.为什么要用代码操作文件
量级时,省力省时。
3.如何用代码操作文件
3.1打开文件:open(‘路径’,‘读写模式’ ,encoding=‘utf8’)
? 文件路径与读写模式是必须的,字符编码是可选的。
3.2关闭文件:.close
res = open(r'/Users/xingchendahai/软件/pycharm/211110/a.txt', 'r', encoding='utf8')
print(res.read())
res.close()
3.3自动关闭:with
with open(r'atxt', 'r', encoding='utf8') as f1:
print(f1.read())
4.读写模式
r:只读
w: 只写
a:只追加(尾部追加)
5.notes
5.1 在pycharm中创建一个普通文本文件:
???在文件夹右击??new??file??输入文件名和文件格式.txt等??确定。
5.2 取消’\字母’产生的含义:
? ??路径中出现了字母与斜杠(\a)的组合产生了特殊含义,在路径字符串前面加 一个r,如:r’/Users/pycharm/211110/a.txt’。
5.3 在pycharm中直接复制绝对路径:
? ??选中文件??选copy path??选absolute path
二、字符编码
1.概述
??由于计算机只识别二进制,但是用户在使用计算机时却可以看到各式各样的语言字符,正是因为字符编码的存在。字符编码是记录了人类字符与数字对应关系的数据。
2.发展史
-
一家独大 ??美国,ASCII码:记录英文字符与数字的对应关系。 ??必须记住两组数码,A-z:65-90、a-z:97-122 -
群雄割据 (1)中国:GBK ? ??GBK记录中文英文与数字的对应关系,英文占用一个字节,中文占用两个甚至更多字节。 (2)日本:shift_JIS ? ??Shift_JIS记录了日文英文与数字的对应关系。 (3)韩国:Euc_kr ? ??Euc_kr记录了韩文英文与数字的对应关系 -
天下一统 (1)unicode ? ??为实现不同国家之间的文本数据能够彼此无障碍交流,unicode产生,统一使用两个及以上字符记录字符与数字的对应关系。 (2)utf8 ? ??utf8是unicode的优化版本,英文占用一个字节,中文占用三个甚至更多字节来储存。现在默认使用的编码是utf8。
3.应用
(1)文件乱码
??文件当初是以什么编码编的,打开时就以什么编码解。
(2)python解释器版本不同而产生的编码差异
??python3.x内部使用utf8 ??python2.x内部默认编码ASCII,转为utf8码需要添加一些操作,具体如下:
coding:utf8
s = u'你'
(3)编码与解码
??编码:将人类能够读懂的字符安装指定的编码转换成数字。 ??解码:将数字按照指定的编码转换成人类能够读懂的字符。
res = s.encode('utf8')
print(res, type(res))
res1 = res.decode('utf8')
print(res1)
|