浙教版(2019)必修1《第四章 數(shù)據(jù)處理與應(yīng)用》2022年單元測試卷(1)
發(fā)布:2024/4/20 14:35:0
一、簡單題
-
1.大力老師收集了學(xué)校高三年級7選3選課數(shù)據(jù),存儲在“選課情況.xlsx”中,其數(shù)據(jù)格式如圖1所示,學(xué)科列下的“1”表示相應(yīng)行的學(xué)生選了該學(xué)科,“0”表示未選。
(1)大力老師收集的數(shù)據(jù)存在一些問題,需要進(jìn)行數(shù)據(jù)整理,下列說法合理的是
A.數(shù)據(jù)集中格式不一致的數(shù)據(jù),需要進(jìn)行格式轉(zhuǎn)換
B.數(shù)據(jù)集中的異常數(shù)據(jù)應(yīng)該直接刪除或忽略
C.數(shù)據(jù)集中的缺失的數(shù)據(jù)可以用任意值填充
D.數(shù)據(jù)集中的重復(fù)數(shù)據(jù)須在審核的基礎(chǔ)上進(jìn)行合并或刪除
(2)為實現(xiàn)統(tǒng)計各班技術(shù)選考人數(shù),并找出技術(shù)選考人數(shù)最多的3個班級,大力老師通過Python編程進(jìn)行數(shù)據(jù)處理,并以圖表2的形式呈現(xiàn)結(jié)果。實現(xiàn)上述功能的Python程序如下,請在橫線處填入合適的代碼。
import pandas as pd
import matplotlib.jye.ai as plt
plt.rcParams[“font.jye.ai-serif“]=[“SimHei“]#中文顯示
df=pd.read_excel(“選課情況.xlsx“)
g=df.groupby(“班級“,as_index=True).技術(shù).①
df1=pd.DataFrame({“班級“:②
df1=df1.sort_values(“③
x=④
y=df1.技術(shù)人數(shù)[0:3]
plt.jye.ai(x,y,lable=“選技術(shù)人數(shù)“)
plt.jye.ai(“技術(shù)選科人數(shù)最多的三個班級“)
plt.jye.ai(“班級“)
plt.jye.ai(“人數(shù)“)
plt.jye.ai( ?。?br />plt.jye.ai(40,50)
plt.jye.ai( ?。?/h2>組卷:1引用:2難度:0.4
一、簡單題
-
3.某商場開業(yè)不久,老板為研判商場運營情況,調(diào)取了最近一個月的商品銷售情況,如圖表1如示。老板想知道哪些商品賣的多,哪些商品產(chǎn)生的利潤多,同時為表彰先進(jìn),需統(tǒng)計每個員工銷售商品數(shù)量,并做成圖表,現(xiàn)老板高薪聘請你為運營總監(jiān),要求你設(shè)計python程序,完成上述功能。
import pandas as pd
import matplotlib.jye.ai as plt
pd.set_option('display.unicode.ambiguous_as_wide',True)#處理列數(shù)據(jù)無法對齊的情況
pd.set_option('display.unicode.east_asian_width',True)
plt.rcParams['font.jye.ai-serif']='simhei'#圖表顯示中文字體
df=pd.read_csv(“sale.jye.ai“,encoding=“gbk“)#導(dǎo)入待處理 CSV 文件
①
df[“利潤“]=(df[“單品售價“]-df[“單品進(jìn)價“])*df[“銷售數(shù)量“]#計算出每一筆業(yè)業(yè)務(wù)利潤的情況
df1=②
print(③
#同理,統(tǒng)計同種商品的月銷量,代碼略
#統(tǒng)計本月每一位銷售人員的商品銷售數(shù)量
df2=df.groupby(“銷售人員“,as_index=False)[“銷售數(shù)量“].sum( )
print(④
x=⑤
plt.figure(figsize=(8,4))
plt.jye.ai(“商場運營情況分析“)
plt.jye.ai(x,y,label=“銷售人員業(yè)績圖“,color=“r“)
plt.jye.ai( )
plt.jye.ai( ?。?/h2>組卷:0引用:3難度:0.4 -
4.小林收集了各地區(qū)的油價存于文件“數(shù)據(jù).xls”中(如圖1所示),他對數(shù)據(jù)進(jìn)行了如下操作:
Ⅰ.將文件“數(shù)據(jù).xls”中的數(shù)據(jù)讀入對象df中;將數(shù)據(jù)中的“八.八”修改為8.8;
Ⅱ.刪除對象“df”中的“優(yōu)惠”列,并將對象“df”進(jìn)行更新;
Ⅲ.添加“平均油價”列,再進(jìn)行相關(guān)計算;將對象“df”中數(shù)據(jù)按地區(qū)降序排序;
Ⅳ.篩選出對象“df”中數(shù)據(jù)“0 號柴油”不大于 8.4 元的數(shù)據(jù)行,保存到對象“d5”中;
Ⅴ.統(tǒng)計對象“d5”中的各個地域的地區(qū)個數(shù),并繪制圖表,如圖2所示。
請在劃線①②③④處填入合適的代碼。
import pandas as pd
import matplotlib.jye.ai as plt
plt.rc('font',**{'family':'SimHei'})
df=pd.read_excel('數(shù)據(jù).xls')
df.①
df=df.②
df['平均油價']=(df['92 號汽油']+df['95 號汽油']+df['0 號柴油'])/3
df=df.sort_values('地區(qū)',ascending=False)
d5=③
g=d5.④
plt.jye.ai(g.jye.ai,g.jye.ai)
plt.jye.ai(“地域分布圖“)
plt.jye.ai( ?。?/h2>組卷:0引用:2難度:0.3