試卷征集
加入會員
操作視頻

小申很喜歡編程,自學(xué)一段時間Python后,想體驗它在數(shù)據(jù)采集和處理方面功能,在老師的建議下他首先嘗試使用python到網(wǎng)絡(luò)上“爬”數(shù)據(jù)。他試著編寫了一個簡單的程序:從某網(wǎng)站爬取了一些單車使用的數(shù)據(jù),保存在bike.csv文件中,在用Excel打開此文件時出現(xiàn)了亂碼,如圖所示。
菁優(yōu)網(wǎng)
(1)小申從網(wǎng)絡(luò)上“爬”數(shù)據(jù),即通過互聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)采集。其完整的流程有三個步驟,分別是:
獲取網(wǎng)頁
獲取網(wǎng)頁
、解析網(wǎng)頁和保存數(shù)據(jù)。
(2)以下
D
D
庫與互聯(lián)網(wǎng)數(shù)據(jù)采集有關(guān)的。
A.Pandas
B.numpy
C.matplotlib
D.requests
(3)網(wǎng)頁請求方式有多種,GET是最常見的方式,一般用于獲取或者查詢資源信息,響應(yīng)速度較快。若已經(jīng)導(dǎo)入了方便發(fā)送HTTP請求的庫,要用get方式獲取網(wǎng)頁數(shù)據(jù)的python代碼(第3行的橫線上)需填寫
requests.jye.ai(url)
requests.jye.ai(url)
;獲取了網(wǎng)頁信息后需要使用BeautifulSoup庫中的方法進(jìn)行網(wǎng)頁解析,則代碼中對應(yīng)橫線(第6行)處應(yīng)填寫
html.jye.ai
html.jye.ai
。
菁優(yōu)網(wǎng)
(4)接上題,要輸出網(wǎng)頁源碼中title標(biāo)簽的文本則先要用select屬性抓取title標(biāo)題,然后再使用print命令輸出,那么print后的橫線處(第8行)應(yīng)填寫
A
A
。
A.title.Text
B.sp.text
C.html.title.text
D.sp.title.text
(5)以下
D
D
是爬蟲技術(shù)可能存在的風(fēng)險。
A.大量占用爬取網(wǎng)站的資源
B.網(wǎng)站敏感信息的獲取造成的不良后果
C.大量訪問目標(biāo)系統(tǒng),帶寬被強制占用
D.以上都是
(6)小申又觀察了這份數(shù)據(jù)文件,發(fā)現(xiàn)所有的英文、數(shù)字均正常顯示,這是因為西文字符集很小,只需要
1
1
個字節(jié)就能表示所有西文字符。其中字節(jié)(Byte)是計算機中信息組織和存儲的基本單位,生活中我們還用過KB、MB、TB等單位,若需要進(jìn)行換算的化:1TB=
240
240
Byte(用冪次表示)。
(7)請簡單說明bike.csv文件里中文字符出現(xiàn)亂碼的原因。

【答案】獲取網(wǎng)頁;D;requests.jye.ai(url);html.jye.ai;A;D;1;240
【解答】
【點評】
聲明:本試題解析著作權(quán)屬菁優(yōu)網(wǎng)所有,未經(jīng)書面同意,不得復(fù)制發(fā)布。
發(fā)布:2024/11/13 3:0:1組卷:7引用:1難度:0.1
相似題
  • 1.小明同學(xué)為備戰(zhàn)明年的計算機類研究生考試,收集了部分高校的計算機專業(yè)復(fù)試分?jǐn)?shù)線并進(jìn)行分析。小明收集到的數(shù)據(jù)如圖1所示。
    菁優(yōu)網(wǎng)
    請幫助小明同學(xué)對表格數(shù)據(jù)進(jìn)行下列分析:
    (1)若想知道這些學(xué)校的總分情況,則在F2單元格先輸入公式
     
    (要求必須使用函數(shù)),然后使用自動填充功能完成單元格F3:F8的計算。
    (2)現(xiàn)要求按照“總分”列進(jìn)行降序排序,并篩選出總分在290分及以上的院校并顯示,最后繪制各個院??偡值拇怪敝螆D(如圖2)。請在程序劃線①②③處填入合適的代碼。
    菁優(yōu)網(wǎng)

    發(fā)布:2024/11/12 1:0:1組卷:3引用:1難度:0.4
  • 2.有如下Python程序段:
    菁優(yōu)網(wǎng)
    若輸入w的值為“( ?。ā 。ǎā 。ā 。保瑒t以上程序運行后,輸出結(jié)果為( ?。?/h2>

    發(fā)布:2024/11/15 11:30:1組卷:1引用:1難度:0.6
  • 3.用Python編輯器打開“考生文件夾\116”下的文件“成績等級.py”,進(jìn)行以下操作并保存結(jié)果。
    (1)學(xué)期末,李老師要根據(jù)學(xué)生的總成績給出相應(yīng)的等級:成績90分及以上等級為“優(yōu)秀”;成績在90和75(包含75分)之間等級為“良好”,成績在75和60 (包含60分)之間等級為“合格”,60分以下為“不合格”。其中信息技術(shù)課的“總成績=0.3*平時成績+0.7*期末成績”(注意:平時成績和期末成績的滿分均為100分)。
    (2)請?zhí)羁胀晟圃摮绦?,實現(xiàn)功能:輸入平時成績和期末成績,輸出學(xué)生的成績等級。
    (3)編寫完成后原名保存并關(guān)閉應(yīng)用軟件。
    注:程序修改時,請把下劃線及序號刪除;不能刪除注釋語句。
    #此程序功能是實現(xiàn)輸出成績等級
    pscore=int(input(“請輸入平時成績:“))#輸入平時成績
    qscore=①#請輸入期末成績
    score=②#計算總成績
    if score>100 or score<0:
    print(“你的成績輸入有誤“)
    elif ③:#優(yōu)秀等級的條件
    print(“優(yōu)秀“)
    elif score>=75:
    ④#輸出相應(yīng)等級
    elif score>=60:
    print(“合格“)
    ⑤:
    print(“不合格“)
     
     
     
     
     

    發(fā)布:2024/11/15 10:0:1組卷:3引用:1難度:0.4
小程序二維碼
把好題分享給你的好友吧~~
APP開發(fā)者:深圳市菁優(yōu)智慧教育股份有限公司 | 應(yīng)用名稱:菁優(yōu)網(wǎng) | 應(yīng)用版本:4.8.2  |  隱私協(xié)議      第三方SDK     用戶服務(wù)條款廣播電視節(jié)目制作經(jīng)營許可證出版物經(jīng)營許可證網(wǎng)站地圖本網(wǎng)部分資源來源于會員上傳,除本網(wǎng)組織的資源外,版權(quán)歸原作者所有,如有侵犯版權(quán),請立刻和本網(wǎng)聯(lián)系并提供證據(jù),本網(wǎng)將在三個工作日內(nèi)改正