搜索
    上传资料 赚现金
    高中信息技术学考复习15pandas处理数据训练含答案
    立即下载
    加入资料篮
    高中信息技术学考复习15pandas处理数据训练含答案01
    高中信息技术学考复习15pandas处理数据训练含答案02
    高中信息技术学考复习15pandas处理数据训练含答案03
    还剩7页未读, 继续阅读
    下载需要10学贝
    使用下载券免费下载
    加入资料篮
    立即下载

    高中信息技术学考复习15pandas处理数据训练含答案

    展开
    这是一份高中信息技术学考复习15pandas处理数据训练含答案,共10页。试卷主要包含了mean,有如下Pythn程序段等内容,欢迎下载使用。

    A.包含一个数组的数据和一个与数据关联的索引,是二维数据结构
    B.其索引值默认是从0起递增的整数
    C.可用列表、字典等创建Series数据结构
    D.其索引可以指定,类型可以为字符串型
    2.下列有关pandas-DataFrame的说法错误的是( )
    A.是一种二维数据结构
    B.由1个索引列和若干个数据列组成
    C.同一个DataFrame对象的数据列类型必须相同
    D.可看作共享同1个index的Series集合
    3.不能实现选取df对象前5行数据记录的语句是( )
    ()(5)
    C.df[0:5]D.df[5]
    回答下列第4~6题。
    4.某DataFrame对象df中包含“准考证号”“班级”“姓名”“文”“数学”…“总分”等10个数据列、多个数据行,能获取对象df第3个数据的“姓名”内容的语句有( )
    ①df[2,'姓名'] ②df.at[2,'姓名'] ③df[2]['姓名'] ④df['姓名'][2] ⑤df.姓名[2]
    A.①②③B.①②④
    C.②④D.②④⑤
    5.如第4题对象df,能够降序排列输出总分大于等于600分的学生数据的代码组合是( )
    ①df=df.srt_values(″总分″,ascending=True)
    ②df=df.srt_values(″总分″,ascending=False)
    ③df=df[″总分″,>=600]
    ④df=df[df[″总分″]>=600]
    ⑤print(df)
    A.①③⑤B.①④⑤
    C.②③⑤D.②④⑤
    6.如第4题对象df1,下列语句中,可以以班级为单位,统计出各班级“总分”的平均值的有( )
    ①df.grupby('班级').mean()
    ②df.grupby('总分').mean()
    ③df.grupby('班级')['总分'].mean()
    ④df.grupby('班级').总分.mean()
    ⑤df.grupby('班级').describe()
    A.①②③④⑤
    B.①②③⑤
    C.①③④⑤
    D.①②③
    7.有如下Pythn程序段。
    imprt pandas as pd
    list=[['周欣怡','湖州',15,646],['王培新','杭州',16,598],['张佳明','杭州',16,609],['林逢春','嘉兴',15,547],['朱梁栋','湖州',16,588],['陈清瑞','嘉兴',15,571]]
    inf=pd.DataFrame(list,clumns=['姓名','地区','年龄','总分'])
    print(inf)
    print('_'? 20)
    print(inf.grupby('地区',as_index=True).mean())
    执行该程序段后,输出的结果是 (单选,填字母)。
    8. 模块用于科学计算(随机数、数组运算等); 模块基于numpy实现,主要用于数据的处理和分析; 用于绘图库。
    9.小明从某网站上收集了2022年4月部分生产资料市场价格变动情况数据,数据集保存在“shuju.xlsx”中,格式如图a所示。
    图a
    为分析相关类别生产资料的涨跌幅情况,小明编写了以下Pythn程序。
    imprt pandas as pd
    imprt matpltlib.pyplt as plt
    plt.rcParams['fnt.sans-serif']=['SimHei'] #正常显示中文字体
    df=pd.read_excel(″shuju.xlsx″)
    df[″涨跌幅″]=
    (1)通过数据计算添加涨跌幅列,请在划线处填写实现的方式。
    计算公式为:涨跌幅=(本期价格-上期价格)/本期价格? 100。
    (2)若要对表格中的数据进行分类统计,并求其平均涨跌幅。请完善以下代码:
    g=df.grupby(″类别″,as_index=False)
    df1=
    df1=df1.srt_values(″涨跌幅″,ascending=False)
    (3)根据上述操作结果,制作一份显示类别涨跌幅平均值的图表,其格式如图b所示。
    各种类别对比分析图
    图b
    请完善以下代码。
    plt.figure(figsize=(8,4))
    plt.title(″各种类别对比分析图″)
    plt.bar(① ,df1[″涨跌幅″],label='涨跌幅')
    plt.xlabel(″类别″)
    plt.ylabel(② )
    plt.legend()
    plt.shw()
    10.某市普通高中选课数据如下图所示,学生从技术、化学、生物等科目中选择三门作为高考选考科目,“1”表示已选择的选考科目。
    图a
    各学校技术选考人数对比
    图b
    为分析各学校的学生选科数据,编写了如下程序:
    imprt pandas as pd
    imprt matpltlib.pyplt as plt
    plt.rc'fnt', ? {'family':'SimHei'}
    plt.rcParams['axes.unicde_minus']=False
    df=pd.read_csv(″xk73.csv″)
    (1)若要了解市里所有选考技术的学生情况,请在划线处给出合适代码,筛选出有选技术科目的同学信息:
    print( )
    (2)使用Pythn编程分析每所学校各科目选考的人数(不同的学校代码表示不同的学校)。请在划线处填入合适的代码。
    g=df.grupby(① ,as index=false) #按学校进行分组
    s2=② #按学校分别统计各科目的选考人数
    s2.srt_values(″技术″,ascending=False) #按技术选考人数进行降序排序
    (3)若要做一个各学校技术选考人数的分析,添加如下程序段:
    plt.figure(figsize=(10,5))
    a=list(s2.学校代码)
    plt.xticks(range(1en(s2.学校代码)),a,rtatin=45) #将各学校代码按降序顺序显示在x轴上
    p1t.① (range(len(s2.学校代码)),② ) #对各学校及对应技术选考人数进行绘图
    plt.xlabel(″学校″)
    plt.ylabel(″技术选考人数″)
    plt.title(″各学校技术选考人数比对″)
    plt.shw()
    划线处的代码应为 (单选,填字母)。
    A.①barh ②df.技术
    B.①plt ②df.技术
    C.①bar ②s2.技术
    D.①scatter ②s2.技术
    11.黄老师获取了学校高三年级学生某次考试数据,并使用Excel软件、Pythn程序进行数据处理,如图所示。
    (1)Excel文件“exam.xlsx”中的数据为 (选填:结构化数据/半结构化数据/非结构化数据)。
    (2)黄老师将文件存储为“exam.xlsx”,并编写了如下Pythn程序对数据进一步分析。请将划线处代码补充完整。
    imprt pandas as pd
    imprt matpltlib.pyplt as plt
    df = pd.read_excel(″exam.xlsx″)
    #统计年级物化生政史地技各个科目的选课人数(本次考试无人缺考)
    fr i in df.clumns[5:12]:
    km=i
    renshu=df[km].cunt()
    print(″选″,km,″的人数为:″,renshu)
    #制作年级男女生语文平均分对比图表
    df2=df.grupby(″性别″,as_index=False).

    plt.bar(df2.性别,② )
    plt.③ (″男女生语文平均分比较″)
    plt.xlabel(″性别″)
    plt.ylabel(″语文平均分″)
    plt.shw()
    12.某地区要对辖区内高中学生的高考选科情况进行统计,前期先用Excel收集各个学校每个学生的选科数据,界面如图所示。
    用Pythn处理上述Excel文件,统计每个学校各个学科的选科情况,并用图表展示学生人数最多的5个学校的物理学科与政治学科人数,代码如下:
    imprt pandas as pd
    imprt numpy as np
    imprt matpltlib.pyplt as plt
    df=pd.read_excel(″xk73.xlsx″)#读数据到pandas的DataFrame结构中
    sc=df.grupby(① ,as_index=False).cunt()#按学校分组计数
    sc=sc.drp('姓名',axis=1)#删除“姓名”列
    sc=sc.rename(clumns={'学生编号':'总人数'})
    #修改“学生编号”为“总人数”
    sc_srt=sc.srt_values(″总人数″,ascending=False)
    #对分组计数结果进行排序
    x=np.arange(1,6)#产生列表[1,2,3,4,5]
    y1=sc_srt.head()[″物理″]

    plt.figure(figsize=(8,4))
    plt.bar(x-0.2,y1,label=″wuli″,width=0.4)
    plt.bar(x+0.2,y2,label=″zhengzhi″,width=0.4)
    plt.ylim(50,400)
    plt.legend()
    df_sum=pd.DataFrame(data=sc.sum()).T
    df_sum['学校代码']='合计'
    ③ #显示图表
    result=sc.append(df_sum) #增加“合计”行
    result.t_excel(″学校人数统计.xlsx″)#保存结果
    在划线处填写合适代码,完善程序。
    训练15 pandas处理数据
    1.A 解析 是一维数据结构。
    2.C 解析 同一个DataFrame对象的不同数据列类型可以不同。
    3.D 解析 head(n)函数返回DataFrame前n行数据,若不设置参数n,则默认返回前5行。df[0:5]选取df对象前5行数据,df[5]选取df对象第6列数据。
    4.D 解析 可以通过at方法获取DataFrame对象单个数据值,格式为df.at[index,clumn],所以②正确;或者根据列标题先获取整列,然后通过行索引获取单个数据值,其中获取一列数据可以通过字典记法或属性检索,第三行数据的行索引是2,所以④⑤均正确。
    5.D 解析 srt_values()函数中,参数ascending,默认值为True,表示升序,为False时是降序;对于DataFrame对象,可以通过布尔型数据选取满足条件的行,正确写法为df[df[″总分″]>=600];最后通过语句⑤输出结果。
    6.C 解析 统计各班级学生“总分”平均值需要按照“班级”分组计算。
    df.grupby('班级').mean()#按“班级”分组,计算各纯数值列平均值。
    df.grupby('总分').mean()#按“总分”分组,计算各纯数值列平均值。
    df.grupby('班级')['总分'].mean()#按“班级”分组,并选取“总分”列计算平均值。
    df.grupby('班级').总分.mean()#按“班级”分组,并选取“总分”列计算平均值。
    df.grupby('班级').describe()#按“总分”分组,计算各纯数值列的平均值、最大值等统计数据。
    7.B 解析 as_index:为True时自动把第1列作为了index,为False时默认索引0、1、2…。
    8.numpy pandas matpltlib
    9.(1)(df.本期价格-df.上期价格)/df.本期价格? 100
    (2)g.mean() (3)①df[″类别″]或df.类别 ②″涨跌幅″
    解析 (1)根据数量关系确定计算公式。
    (2)计算平均值使用mean()函数。
    (3)①观察题图b可知需要填横坐标数据来源。②此处需要填写横坐标y的标签(ylabel),由题图可知应该是“涨跌幅”。
    10.(1)df[df.技术==1](或df[df[″技术″]==1]) (2)①″学校代码″ ②g.sum()或g.cunt() (3)D 解析 本题考查pandas及绘图模块知识。(1)Dataframe中,要对某列进行筛选(查找并显示符合条件的值),可以通过df[df[″技术″]==1]或df[df.技术==1]来实现。(2)此处考查pandas中分组函数grupby的用法。依题意,本条语句按学校进行分组,分组的字段名应为“学校代码”,故①处填″学校代码″;①处代码已将分组后的对象赋值组变量g,②空对其进行计数,故填:g.cunt()。(3)观察题图b,可知当前是散点图(scatter),故选D。
    11.(1)非结构化数据 (2)①mean() ②df2.语文 ③title
    解析 (1)Excel中的数据是属于结构化数据(每列数据类型均统一)。(2)①此处求平均值,因此使用mean()函数。②根据性别分组后,df2对象中‘语文’列存放了男女生语文成绩平均分,创建柱形图,x轴为性别,y轴为男女生语文成绩平均分,故答案为df2.语文。③此处显示的标题,因此答案如上。
    12.①″学校代码″ ②y2=sc_srt.head()[″政治″](或y2=sc_srt.head(5)[″政治″]) ③plt.shw() 解析 本题考查数据处理知识。(1)①题干说明需要“统计每个学校各个学科的选科情况”,所以需要根据“学校编号”分类汇总统计各学校的选科情况,此空填写分组的关键字,答案为“学校代码”。②根据上下文,此空是获取学生人数最多的5个学校的政治学科人数。前面代码段已经根据各学生总人数降序排序,再结合上一段代码,此空只需要将“物理”修改成“政治”。head()函数返回DataFrame的前n个数据记录,如果参数不写,默认参数是5,所以此空答案:y2=sc_srt.head()[″政治″]或y2=sc_srt.head(5)[″政治″]。③代码段plt.shw()的功能是显示图形。(2)此空考查对图表结果呈现的辨析。代码段“plt.legend()”,说明最后的结果有图例,排除CD。代码段“plt.ylim(50,400)”,说明y坐标的取值范围是[50,400],所以排除A,选B。
    相关试卷

    浙教版 (2019)必修1 数据与计算第一章 数据与信息1.5 数据与大数据课后测评: 这是一份浙教版 (2019)必修1 数据与计算第一章 数据与信息1.5 数据与大数据课后测评,共5页。试卷主要包含了选择题,判断题等内容,欢迎下载使用。

    浙教版 (2019)必修1 数据与计算1.3 数据采集与编码精练: 这是一份浙教版 (2019)必修1 数据与计算1.3 数据采集与编码精练,共7页。试卷主要包含了选择题,判断题,简答题等内容,欢迎下载使用。

    浙教版 (2019)必修1 数据与计算1.1 感知数据随堂练习题: 这是一份浙教版 (2019)必修1 数据与计算1.1 感知数据随堂练习题,共6页。试卷主要包含了选择题,综合题等内容,欢迎下载使用。

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:0份资料
    • 充值学贝下载 90%的用户选择 本单免费
    • 扫码直接下载
    选择教习网的 4 个理由
    • 更专业

      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿

    • 更丰富

      涵盖课件/教案/试卷/素材等各种教学资源;500万+优选资源 ⽇更新5000+

    • 更便捷

      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤

    • 真低价

      超⾼性价⽐, 让优质资源普惠更多师⽣

    开票申请 联系客服
    本次下载需要:0学贝 0学贝 账户剩余:0学贝
    本次下载需要:0学贝 原价:0学贝 账户剩余:0学贝
    了解VIP特权
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送

        扫码支付后直接下载

        0元

        扫码支付后直接下载

        使用学贝下载资料比扫码直接下载优惠50%
        充值学贝下载,本次下载免费
        了解VIP特权
        • 微信
        • 支付宝

        微信扫码支付

        支付宝扫码支付(支持花呗)

        到账0学贝
        • 微信
        • 支付宝

        微信扫码支付

        支付宝扫码支付 (支持花呗)

          下载成功

          Ctrl + Shift + J 查看文件保存位置

          若下载不成功,可重新下载,或查看 资料下载帮助

          本资源来自成套资源

          更多精品资料

          正在打包资料,请稍候…

          预计需要约10秒钟,请勿关闭页面

          服务器繁忙,打包失败

          请联系右侧的在线客服解决

          单次下载文件已超2GB,请分批下载

          请单份下载或分批下载

          支付后60天内可免费重复下载

          我知道了
          正在提交订单

          欢迎来到教习网

          • 900万优选资源,让备课更轻松
          • 600万优选试题,支持自由组卷
          • 高质量可编辑,日均更新2000+
          • 百万教师选择,专业更值得信赖
          微信扫码注册
          qrcode
          二维码已过期
          刷新

          微信扫码,快速注册

          还可免费领教师专享福利「樊登读书VIP」

          手机号注册
          手机号码

          手机号格式错误

          手机验证码 获取验证码

          手机验证码已经成功发送,5分钟内有效

          设置密码

          6-20个字符,数字、字母或符号

          注册即视为同意教习网「注册协议」「隐私条款」
          QQ注册
          手机号注册
          微信注册

          注册成功

          下载确认

          下载需要:0 张下载券

          账户可用:0 张下载券

          立即下载

          如何免费获得下载券?

          加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

          即将下载

          高中信息技术学考复习15pandas处理数据训练含答案

          该资料来自成套资源,打包下载更省心

          [共10份]
          浏览全套
            立即下载(共1份)
            返回
            顶部