哈喽 , 大家好 , 今天我们继续介绍pandas面试题 。
1、eval函数的用法
跟上篇文章说的assign函数的用法差不多 , eval函数可以通过如下方式新增列:
直接定义某列的数据值:
df1.eval('c=1')
2、文本格式转换:
字符全部变成小写
s.str.lower()
# 字符全部大写
s.str.upper()
# 每个单词首字母大写
s.str.title()
# 字符串第一个字母大写
s.str.capitalize()
# 大小写字母转换
s.str.swapcase()
3、给定DataFrame , 有列A B , A的值在1-100(含) , 对A列每10步长 , 求对应的B的和
df = pd.DataFrame({'A': [121111333435407999
'B': [121111333435407999
)
print(df)
df1 = df.groupby(pd.cut(df['A'
np.arange(0 101 10)))['B'
.sum()
print(df1)
4、一个全数值的DataFrame , 返回最大3个值的坐标
df = pd.DataFrame(np.random.random(size=(5 3)))
print(df)
df.unstack().sort_values()[-3:
.index.tolist()
5、可视化
import matplotlib.pyplot as plt
df = pd.DataFrame({\"xs\":[15281
\"ys\":[42196
)
plt.style.use('ggplot')
画出df的散点图:
df.plot.scatter(\"xs\" \"ys\" color = \"black\" marker = \"x\")
6、每连续4个月为一组 , 求最大值所在的日期
s.groupby(pd.Grouper(freq='4M')).idxmax()
7、创建2015-2016每月第三个星期四的序列
pd.date_range('2015-01-01' '2016-12-31' freq='WOM-3THU')
8、利用to_frame()实现Series转DataFrame」
s = pd.Series([0 1 2
)
# Series转为DataFrame , name参数用于指定转换后的字段名
s = s.to_frame(name='列名')
【meta|【全面】pandas数据分析面试题(十一)汇总!】好了 , 今天的内容就先到这里了 , 明天见!
- 对于智能手机|红米k50到底有多强?
- 芯片|郭正亮:14nm以上芯片中国世界第一,外国制造打不过中国
- |置顶文案 永不过时
- meta|关于Facebook商城赚钱项目
- 谭铁牛院士获国际模式识别最高奖,34年来首次颁给北美和欧洲以外学者
- 余承东|余承东:一些车厂用鸿蒙系统但交互自己做 体验真的很垃圾
- 聚焦自主创新研发 全面促进智能建造领域新发展
- 【探秘安全之“XIN”(二)】八星汇聚、各显其能,这个安全矩阵不一般
- meta|Meta账号系统正式上线,不再强制绑定Facebook
- ColorOS|息屏、实用功能明显增加?ColorOS 13亮点推荐提前看!