提高效率的工具

pandas-apply-lambda

pandas官方文档

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
df = pd.read_csv('bookManage.csv')
df.info()

RangeIndex: 200 entries, 0 to 199
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   id      200 non-null    int64  
 1   书名      200 non-null    object 
 2   类型      200 non-null    object 
 3   作者      200 non-null    object 
 4   价格      200 non-null    float64
 5   上架时间    200 non-null    object 
dtypes: float64(1), int64(1), object(4)
memory usage: 9.5+ KB
df.head()
id 书名 类型 作者 价格 上架时间
0 105 逆向分析实战 编程 冀云 49.4 2020/10/1
1 145 说史记 历史 杨早 90.8 2020/10/1
2 159 王小波全集 文学 王小波 13.1 2020/10/1
3 171 乡下人的悲观 社会科学 J.D.万斯 36.9 2020/10/1
4 4 C#从入门到精通 编程 明日科技 39.9 2020/10/10
# 加一个特征 价格区间 分为便宜,中等,昂贵
df['rate'] = df.价格
df
id 书名 类型 作者 价格 上架时间 价格区间 rate
0 105 逆向分析实战 编程 冀云 49.4 2020/10/1 49.4 49.4
1 145 说史记 历史 杨早 90.8 2020/10/1 90.8 90.8
2 159 王小波全集 文学 王小波 13.1 2020/10/1 13.1 13.1
3 171 乡下人的悲观 社会科学 J.D.万斯 36.9 2020/10/1 36.9 36.9
4 4 C#从入门到精通 编程 明日科技 39.9 2020/10/10 39.9 39.9
... ... ... ... ... ... ... ... ...
195 170 乡土中国 社会科学 费孝通 19.7 2020/9/29 19.7 19.7
196 40 程序员的数学 编程 结城浩等 181.7 2020/9/30 181.7 181.7
197 93 历史只露半边脸 历史 刘绪义 56.8 2020/9/30 56.8 56.8
198 104 你是我白天黑夜不落的星 文学 莱蒙托夫 12.5 2020/9/30 12.5 12.5
199 172 小镇喧嚣:一个乡镇 社会科学 吴毅 59.2 2020/9/30 59.2 59.2

200 rows × 8 columns

def getRate(x):
    if x >= 100:
        return "昂贵"
    if x <= 50:
        return "便宜"
    if x > 50 and x < 100:
        return "中等"

df.rate = df.rate.apply(lambda x:getRate(x))
df
id 书名 类型 作者 价格 上架时间 价格区间 rate
0 105 逆向分析实战 编程 冀云 49.4 2020/10/1 49.4 便宜
1 145 说史记 历史 杨早 90.8 2020/10/1 90.8 中等
2 159 王小波全集 文学 王小波 13.1 2020/10/1 13.1 便宜
3 171 乡下人的悲观 社会科学 J.D.万斯 36.9 2020/10/1 36.9 便宜
4 4 C#从入门到精通 编程 明日科技 39.9 2020/10/10 39.9 便宜
... ... ... ... ... ... ... ... ...
195 170 乡土中国 社会科学 费孝通 19.7 2020/9/29 19.7 便宜
196 40 程序员的数学 编程 结城浩等 181.7 2020/9/30 181.7 昂贵
197 93 历史只露半边脸 历史 刘绪义 56.8 2020/9/30 56.8 中等
198 104 你是我白天黑夜不落的星 文学 莱蒙托夫 12.5 2020/9/30 12.5 便宜
199 172 小镇喧嚣:一个乡镇 社会科学 吴毅 59.2 2020/9/30 59.2 中等

200 rows × 8 columns

将pandas中Series、DataFrame类型转成list类型

上一篇

初探k8s

下一篇

你也可能喜欢

发表评论

您的电子邮件地址不会被公开。 必填项已用 * 标注

提示:点击验证后方可评论!

插入图片

个人微信公众号

we-tuiguang

qq交流群

群号:1046260719

微信扫一扫

微信扫一扫