pandas官方文档
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
df = pd.read_csv('bookManage.csv')
df.info()
RangeIndex: 200 entries, 0 to 199
Data columns (total 6 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 id 200 non-null int64
1 书名 200 non-null object
2 类型 200 non-null object
3 作者 200 non-null object
4 价格 200 non-null float64
5 上架时间 200 non-null object
dtypes: float64(1), int64(1), object(4)
memory usage: 9.5+ KB
df.head()
|
id |
书名 |
类型 |
作者 |
价格 |
上架时间 |
0 |
105 |
逆向分析实战 |
编程 |
冀云 |
49.4 |
2020/10/1 |
1 |
145 |
说史记 |
历史 |
杨早 |
90.8 |
2020/10/1 |
2 |
159 |
王小波全集 |
文学 |
王小波 |
13.1 |
2020/10/1 |
3 |
171 |
乡下人的悲观 |
社会科学 |
J.D.万斯 |
36.9 |
2020/10/1 |
4 |
4 |
C#从入门到精通 |
编程 |
明日科技 |
39.9 |
2020/10/10 |
# 加一个特征 价格区间 分为便宜,中等,昂贵
df['rate'] = df.价格
df
|
id |
书名 |
类型 |
作者 |
价格 |
上架时间 |
价格区间 |
rate |
0 |
105 |
逆向分析实战 |
编程 |
冀云 |
49.4 |
2020/10/1 |
49.4 |
49.4 |
1 |
145 |
说史记 |
历史 |
杨早 |
90.8 |
2020/10/1 |
90.8 |
90.8 |
2 |
159 |
王小波全集 |
文学 |
王小波 |
13.1 |
2020/10/1 |
13.1 |
13.1 |
3 |
171 |
乡下人的悲观 |
社会科学 |
J.D.万斯 |
36.9 |
2020/10/1 |
36.9 |
36.9 |
4 |
4 |
C#从入门到精通 |
编程 |
明日科技 |
39.9 |
2020/10/10 |
39.9 |
39.9 |
... |
... |
... |
... |
... |
... |
... |
... |
... |
195 |
170 |
乡土中国 |
社会科学 |
费孝通 |
19.7 |
2020/9/29 |
19.7 |
19.7 |
196 |
40 |
程序员的数学 |
编程 |
结城浩等 |
181.7 |
2020/9/30 |
181.7 |
181.7 |
197 |
93 |
历史只露半边脸 |
历史 |
刘绪义 |
56.8 |
2020/9/30 |
56.8 |
56.8 |
198 |
104 |
你是我白天黑夜不落的星 |
文学 |
莱蒙托夫 |
12.5 |
2020/9/30 |
12.5 |
12.5 |
199 |
172 |
小镇喧嚣:一个乡镇 |
社会科学 |
吴毅 |
59.2 |
2020/9/30 |
59.2 |
59.2 |
200 rows × 8 columns
def getRate(x):
if x >= 100:
return "昂贵"
if x <= 50:
return "便宜"
if x > 50 and x < 100:
return "中等"
df.rate = df.rate.apply(lambda x:getRate(x))
df
|
id |
书名 |
类型 |
作者 |
价格 |
上架时间 |
价格区间 |
rate |
0 |
105 |
逆向分析实战 |
编程 |
冀云 |
49.4 |
2020/10/1 |
49.4 |
便宜 |
1 |
145 |
说史记 |
历史 |
杨早 |
90.8 |
2020/10/1 |
90.8 |
中等 |
2 |
159 |
王小波全集 |
文学 |
王小波 |
13.1 |
2020/10/1 |
13.1 |
便宜 |
3 |
171 |
乡下人的悲观 |
社会科学 |
J.D.万斯 |
36.9 |
2020/10/1 |
36.9 |
便宜 |
4 |
4 |
C#从入门到精通 |
编程 |
明日科技 |
39.9 |
2020/10/10 |
39.9 |
便宜 |
... |
... |
... |
... |
... |
... |
... |
... |
... |
195 |
170 |
乡土中国 |
社会科学 |
费孝通 |
19.7 |
2020/9/29 |
19.7 |
便宜 |
196 |
40 |
程序员的数学 |
编程 |
结城浩等 |
181.7 |
2020/9/30 |
181.7 |
昂贵 |
197 |
93 |
历史只露半边脸 |
历史 |
刘绪义 |
56.8 |
2020/9/30 |
56.8 |
中等 |
198 |
104 |
你是我白天黑夜不落的星 |
文学 |
莱蒙托夫 |
12.5 |
2020/9/30 |
12.5 |
便宜 |
199 |
172 |
小镇喧嚣:一个乡镇 |
社会科学 |
吴毅 |
59.2 |
2020/9/30 |
59.2 |
中等 |
200 rows × 8 columns