meta|【全面】pandas数据分析面试题(十一)汇总!

meta|【全面】pandas数据分析面试题(十一)汇总!

哈喽 , 大家好 , 今天我们继续介绍pandas面试题 。
1、eval函数的用法
跟上篇文章说的assign函数的用法差不多 , eval函数可以通过如下方式新增列:
直接定义某列的数据值:
df1.eval('c=1')

2、文本格式转换:
字符全部变成小写
s.str.lower()
# 字符全部大写
s.str.upper()
# 每个单词首字母大写
s.str.title()
# 字符串第一个字母大写
s.str.capitalize()
# 大小写字母转换
s.str.swapcase()
3、给定DataFrame , 有列A B , A的值在1-100(含) , 对A列每10步长 , 求对应的B的和
df = pd.DataFrame({'A': [121111333435407999

'B': [121111333435407999
)
print(df)
df1 = df.groupby(pd.cut(df['A'
np.arange(0 101 10)))['B'
.sum()
print(df1)
4、一个全数值的DataFrame , 返回最大3个值的坐标
df = pd.DataFrame(np.random.random(size=(5 3)))
print(df)
df.unstack().sort_values()[-3:
.index.tolist()
5、可视化
import matplotlib.pyplot as plt
df = pd.DataFrame({\"xs\":[15281
\"ys\":[42196
)
plt.style.use('ggplot')
画出df的散点图:
df.plot.scatter(\"xs\" \"ys\" color = \"black\" marker = \"x\")
6、每连续4个月为一组 , 求最大值所在的日期
s.groupby(pd.Grouper(freq='4M')).idxmax()
7、创建2015-2016每月第三个星期四的序列
pd.date_range('2015-01-01' '2016-12-31' freq='WOM-3THU')
8、利用to_frame()实现Series转DataFrame」
s = pd.Series([0 1 2
)
# Series转为DataFrame , name参数用于指定转换后的字段名
s = s.to_frame(name='列名')
【meta|【全面】pandas数据分析面试题(十一)汇总!】好了 , 今天的内容就先到这里了 , 明天见!