Skip to content
Draft
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
5 changes: 5 additions & 0 deletions python/.vscode/settings.json
Original file line number Diff line number Diff line change
@@ -0,0 +1,5 @@
{
"cSpell.words": [
"iloc"
]
}
34 changes: 34 additions & 0 deletions python/PyData/pandas.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,34 @@
- 读取各种表格文件:`pd.read_*()`
- 文件没有表头时,需指定 `header=None` 参数
- 为文件修改表头:`header=['', '', ...]`。注意长度需要和表头一致,不能多也不能少

- `DataFrame` 对象
- `values()` 返回二维数组。数据不包括表头信息。
- `columns` 用于获取/修改表头。
- `rename()`
- `columns={'old_header_name': 'new_header_name', ...}` 重命名指定表头
- `inplace=True` 指定为 True 时在原 DataFrame 对象上修改表头
- `to_*()` 转换为其他类型的表格文件,比如 `to_csv()`
- 第一个参数为文件输出的目录
- `index=False` 表示不属于索引值,即不会新增一列
- `iloc[]` 基于位置(第几行、第几列)进行选择。不支持字符串
- `iloc[ 0:1 , 1:2 ]` 获取 `[0,1)` 行,`[1,2)` 列的内容,返回 DataFrame 对象。
- `iloc[ 0:1 , : ]` 获取 `[0,1)` 行,所有列的内容。返回 DataFrame 对象
- `iloc[ : , 0:3 ]` 获取所有行,`[0,3)` 列的内容。返回 DataFrame 对象
- `iloc[ 0:2 ]` 等同于 `iloc[ 0:2 , : ]`。返回 DataFrame 对象
- `iloc[ [0,2] , : ]` 获取第 `0`, `2`, `4` 行,所有列的内容,返回 DataFrame 对象。
- `iloc[ [0,2] ]` 等同 `iloc[ [0,2], : ]`,返回 DataFrame 对象
- `iloc[ 0 ]` 获取第一行的内容, 返回 `Series` 对象。
- `iloc[ (0 , 1) ]` 获取第一行第二列的单元格内容,返回类型为该单元格所对应的数据类型,比如 str
- `iloc[ 0 , 1 ]` 等同 `iloc[ (0,1) ]`,返回类型为单元格所对应类型
- 还支持布尔类型数组,数组大小要求与行或列对应。故一般用在遍历时返回一个布尔值。
- `loc[]` 根据标签(列表头、行索引)进行选择。
- 与 `iloc[]` 的区别
- `loc[0]` 中的数字表示标签,它选择的是所有行索引值为数字 `0` 的那些行(数量不确定),返回一个 DataFrame 对象。
- 而 `iloc[0]` 中的数字表示的是位置 `0`,无论该行的索引值是什么,它都只会选择第一行,返回一个 `Series` 对象。
- `Series` 对象
- `replace()` 批量替换值
- `to_replace=<旧值>`
- `value=<新值>`
- `inplace=True` 表示在原 Series 对象上修改。
- `map()` 遍历,暂时没用到,知道有这个方法就行。
8 changes: 8 additions & 0 deletions python/PyData/pydub.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,8 @@
`from pydub import AudioSegment`

- 读取音频
- `AudioSegment.from_mp3(<输入路径>)`
- `AudioSegment` 对象
- `duration_seconds` 查看音频时长
- `export(<导出路径>, format='mp3')`
- `[:(duration-20) * 1000]` 剪切,单位是毫秒。
12 changes: 12 additions & 0 deletions python/README.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,12 @@
# 学习 Python 基本内容

量少,并且容易看懂的标准库

- `bisect`
- `heapq`
from collections import deque

## 可参考网站

- [py 基本知识](https://docs.python.org/zh-cn/3.11/tutorial/index.html)
- [Ask Python](https://www.askpython.com/)
1 change: 1 addition & 0 deletions python/old-note-py-pyData/.gitignore
Original file line number Diff line number Diff line change
@@ -0,0 +1 @@
AI/resource/creditcard.csv
Loading