1、在单元格中,存在杂乱的数据,有时为了统计需要,可以进行排序。
2、代码如下:#导入包import pandas as pdfrom pan蟠校盯昂das import DataFr锾攒揉敫ame,Series#设置路径path='C:\\Users\\jyjh\\Desktop\\CHROMOSOME_NUMBERS_DATA_OF_GENUS.csv'#数据列索引columns_1=['Genus','Latin_name','Error','Gametophytic','Sporophytic','Paresd_n']columns_2=['Gametophytic','Sporophytic','Paresd_n']#构建数据表frame=DataFrame(pd.read_csv(path))#填充NaN为0for i in columns_1: frame[i]=frame[i].fillna(0)#遍历数据表中的元素for i in columns_2: for j in frame.index:#临时列表 temporary=[] if isinstance(frame[i].ix[j],int): temporary=frame[i].ix[j] else: for k in frame[i].ix[j].split(','): temporary.append(int(k.strip()))#列表元素排序并赋值返回 temporary.sort() frame[i].ix[j]=temporary#显示错误的位置 print(i+' '+str(j))#保存文件frame.to_csv('data_1.csv')
3、结果如图 :数据经过排序,呈递增分布。