polars导入csv文件时指定列数据类型schema {column1: pl.Int64,column2: pl.Float64,column3: pl.Utf8}df pl.read_csv(data.csv, schemaschema)defpddaoru_csv(filedir):order_5G[承建方,厂家,市名称,统计局区县,数据时间,小区名称,基站ID,小区ID,小区覆盖类别,频段,带宽,小区覆盖区域,小区上行PRB平均占用率,小区下行PRB平均占用率]dtypes {承建方:pl.String,厂家:pl.String,省名称:pl.String,市名称:pl.String,统计局区县:pl.String,数据时间:pl.String,基站名称:pl.String,小区名称:pl.String,基站ID:pl.Int64,小区ID:pl.Int64,组网方式:pl.String,小区覆盖类别:pl.String,频段:pl.String,带宽:pl.Int64}#df1 pd.read_excel(filedir,sheet_namename) # polars导入excel文件命令df pl.read_csv(filedir,encodingANSI,schemadtypes)# polars导入excel文件命令print(df.dtypes)pf df.to_pandas()# polars导入excel文件命令#pf df1.iloc[4:] # polars导入excel文件命令pfpf[order_5G]kkkpf.copy()print(f导入{filedir}文件,源有{len(df)}行有效数据{len(pf)}行)returnkkk
polars导入csv文件时指定列数据类型
发布时间:2026/5/20 10:30:47
polars导入csv文件时指定列数据类型schema {column1: pl.Int64,column2: pl.Float64,column3: pl.Utf8}df pl.read_csv(data.csv, schemaschema)defpddaoru_csv(filedir):order_5G[承建方,厂家,市名称,统计局区县,数据时间,小区名称,基站ID,小区ID,小区覆盖类别,频段,带宽,小区覆盖区域,小区上行PRB平均占用率,小区下行PRB平均占用率]dtypes {承建方:pl.String,厂家:pl.String,省名称:pl.String,市名称:pl.String,统计局区县:pl.String,数据时间:pl.String,基站名称:pl.String,小区名称:pl.String,基站ID:pl.Int64,小区ID:pl.Int64,组网方式:pl.String,小区覆盖类别:pl.String,频段:pl.String,带宽:pl.Int64}#df1 pd.read_excel(filedir,sheet_namename) # polars导入excel文件命令df pl.read_csv(filedir,encodingANSI,schemadtypes)# polars导入excel文件命令print(df.dtypes)pf df.to_pandas()# polars导入excel文件命令#pf df1.iloc[4:] # polars导入excel文件命令pfpf[order_5G]kkkpf.copy()print(f导入{filedir}文件,源有{len(df)}行有效数据{len(pf)}行)returnkkk