python分两列输出

分割成一个包含两个元素列表的列

对于一个已知分隔符的简单分割(例如,用破折号分割或用空格分割).str.split() 方法就足够了 。 它在字符串的列(系列)上运行,并返回列表(系列)。

>>> import pandas as pd

>>> df = pd.DataFrame({'AB': ['A1-B1', 'A2-B2']})

>>> df

AB

0 A1-B1

1 A2-B2

>>> df['AB_split'] = df['AB'].str.split('-')

>>> df

AB AB_split

0 A1-B1 [A1, B1]

1 A2-B2 [A2, B2]

分割成两列,每列包含列表的相应元素

下面来看下如何从:分割成一个包含两个元素列表的列至分割成两列,每列包含列表的相应元素。

>>> df['AB'].str[0]

0 A

1 A

Name: AB, dtype: object

>>> df['AB'].str[1]

0 1

1 2

Name: AB, dtype: object

因此可以得到

>>> df['AB'].str.split('-', 1).str[0]

0 A1

1 A2

Name: AB, dtype: object

>>> df['AB'].str.split('-', 1).str[1]

0 B1

1 B2

Name: AB, dtype: object

可以通过如下代码将pandas的一列分成两列:

>>> df['A'], df['B'] = df['AB'].str.split('-', 1).str

>>> df

AB AB_split A B

0 A1-B1 [A1, B1] A1 B1

1 A2-B2 [A2, B2] A2 B2

补充知识:pandas某一列中每一行拆分成多行的方法

在处理数据过程中,常会遇到将一条数据拆分成多条,比如一个人的地址信息中,可能有多条地址,既有家庭地址也有工作地址,还有电话信息等等类似的情况,实际使用数据的时候又需要分开处理,这个时候就需要将这一条数据进行拆分成多条,以方便使用。

在pandas中如何对DataFrame进行相关操作呢,经查阅相关资料,发现了一个简单的办法,

info.drop(['city'], axis=1).join(info['city'].str.split(' ', expand=True).stack().reset_index(level=1, drop=True).rename('city'))

看起来非常之长,分开来看,流程如下:

将需要拆分的数据使用split拆分工具拆分,并使用expand功能拆分成多列

将拆分后的多列数据进行列转行操作(stack),合并成一列

将生成的复合索引重新进行reset保留原始的索引,并命名

将上面处理后的DataFrame和原始DataFrame进行join操作,默认使用的是索引进行连接

具体操作如下:

预操作:生成需要使用的DataFrame

# 用来生成DataFrame的工具

from pydbgen import pydbgen

myDB=pydbgen.pydb()

# 生成一个DataFrame

info = myDB.gen_dataframe(10,['name','phone','city','state'])

结果如下:

name

phone-number

city

state

0

Hannah Richard

810-859-7815

Irwinville

Louisiana

1

Ronald Berry

591-564-0585

Glen Ellen

Minnesota

2

Caitlin Barron

969-840-8580

Dubois

Oklahoma

3

Felicia Stephens

154-858-1233

Veedersburg

Alaska

4

Shelly Dennis

343-104-9365

Mattapex

Virginia

5

Nicholas Hill

992-239-1954

Moneta

Minnesota

6

Steve Bradshaw

164-081-7811

Ten Broeck

Colorado

7

Gail Johnston

155-259-9514

Wayan

Virginia

8

John Gray

409-892-4716

Darlington

Pennsylvania

9

Katherine Bautista

185-861-1677

McNab

Texas

假如现在我们要对city列进行进行拆分,按照空格拆分,转换成多行的数据,

第一步:拆分,生成多列

info_city = info['city'].str.split(' ', expand=True)

结果如下:

0

1

0

Irwinville

None

1

Glen

Ellen

2

Dubois

None

3

Veedersburg

None

4

Mattapex

None

5

Moneta

None

6

Ten

Broeck

7

Wayan

None

8

Darlington

None

9

McNab

None

可以看到已经将原始数据拆分成了2列,对于无法拆分的数据为None

第二步:行转列

info_city = info_city.stack()

结果如下:

0

0

Irwinville

1

0

Glen

1

Ellen

2

0

Dubois

3

0

Veedersburg

4

0

Mattapex

5

0

Moneta

6

0

Ten

1

Broeck

7

0

Wayan

8

0

Darlington

9

0

McNab

其中前面两列是索引,返回的是一个series,没有名字的series

第三步:重置索引,并命名(并删除多于的索引)

info_city = info_city.reset_index(level=1, drop=True)

结果如下:

0

Irwinville

1

Glen

1

Ellen

2

Dubois

3

Veedersburg

4

Mattapex

5

Moneta

6

Ten

6

Broeck

7

Wayan

8

Darlington

9

McNab

第四步:和原始数据合并

info_new = info.drop(['city'], axis=1).join(info_city)

结果如下:

name

phone-number

state

city

0

Hannah Richard

810-859-7815

Louisiana

Irwinville

1

Ronald Berry

591-564-0585

Minnesota

Glen

1

Ronald Berry

591-564-0585

Minnesota

Ellen

2

Caitlin Barron

969-840-8580

Oklahoma

Dubois

3

Felicia Stephens

154-858-1233

Alaska

Veedersburg

4

Shelly Dennis

343-104-9365

Virginia

Mattapex

5

Nicholas Hill

992-239-1954

Minnesota

Moneta

6

Steve Bradshaw

164-081-7811

Colorado

Ten

6

Steve Bradshaw

164-081-7811

Colorado

Broeck

7

Gail Johnston

155-259-9514

Virginia

Wayan

8

John Gray

409-892-4716

Pennsylvania

Darlington

9

Katherine Bautista

185-861-1677

Texas

McNab

需要特别注意的是,需要使用原始的连接新生成的,因为新生成的是一个series没有join方法,也可以通过将生成的series通过to_frame方法转换成DataFrame,这样就没有什么差异了

写了这么多,记住下面的就行了:

info.drop([‘city'], axis=1).join(info[‘city'].str.split(' ', expand=True).stack().reset_index(level=1, drop=True).rename(‘city'))

如果原数据中已经是list了,可以将info[‘city'].str.split(' ', expand=True)这部分替换成info[‘city'].apply(lambda x: pd.Series(x)),就可以达到相同的目的。

以上这篇Pandas实现一列数据分隔为两列就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

(0)

相关推荐

  • 将excel中某一列拆分为多个列

    昨天有学员学 python文本分析:从入门到精通 这门课时遇到jupyter配置问题,交流快结束的时候聊到excel数据拆分,说如果咱们后续提供excel数据分析的课程,比如excel数据拆分我还会购 ...

  • python-13-pandas的常用操作

    皮皮冰燃 2020-10-22 17:49:19 56 收藏 分类专栏: python3 文章标签: python 版权 (1)获取数据 (2)数据处理:处理缺失数据,可视化 (3)特征工程 (4)算 ...

  • dython是什么?

    大家都知道Python,但是应该很少有人听过dython,dython是python中的一款数据建模库.尽管已经有了scikit-learn.statsmodels.seaborn等非常优秀的数据建模 ...

  • Pandas中groupby的这些用法你都知道吗?

    导读 pandas作为Python数据分析的瑞士军刀,集成了大量实用的功能接口,基本可以实现数据分析一站式处理.前期,笔者完成了一篇pandas系统入门教程,也针对几个常用的分组统计接口进行了介绍,今 ...

  • (3条消息) 【学习笔记】python实现excel数据处理

    概述 Excel固然功能强大,也有许多函数实现数据处理功能,但是Excel仍需大量人工操作,虽然能嵌入VB脚本宏,但也容易染上宏病毒.python作为解释性语言,在数据处理方面拥有强大的函数库以及第三 ...

  • 字符串拆分、去重、合并,你会吗?

    你好,我是刘卓.欢迎来到我的公号,excel函数解析.今天来分享一个字符串拆分.去重.合并的案例. -01- 具体应用 下图A列是数据源,每个单元格都是一个字符串.每个字符串都是由一些近义词连成的,并 ...

  • 数据清洗的 2 个小技巧,好用

    数据清洗的 2 个小技巧,好用

  • Excel如何将一列中的正数和负数自动分到两列

    本例需要将数值按正负数分离出来,用拆分的思路就不能解决了,如图3-90所示. 图3-90 操作 步骤1:在正数列C3单元格中输入公式=IF(B3>0,B3,""),意思是如果 ...

  • 都是名表,为什么瑞士要分两场表展?

    这是在今日头条上被邀请回答的问题,"为什么巴展没有积家.朗格?SIHH没有劳力士?" 表迷们不要笑,大部分人还真是搞不清楚两个表展是咋回事,今天我们来认真回答一下这个问题. 巴展, ...

  • 学中医的都会把脉吗?医生分两个群体来讲,科班与师承

    这个其实不太好回答,这个"会"的程度没有一个统一的标准. 它不是一个简单的技能,比如小孩子学走路,会走了就是会走,不会走就是不会走. 学中医的人一般分为科班与非科班两种. 科班的就 ...

  • EXCEL如何将两列数据合并为一列并在中间加符号

    EXCEL具有多列的功能,那么如何将两列,转化为一列呢,转化了之后,是否可以在两列之间,加上一些符号呢 工具/原料 EXCEL2007 方法/步骤 1 首先在电脑上打开一个新的工作簿,用来输入数据 2 ...

  • 如何将Excel表格中的日期和时间分开成两列?

    Excel的制作通常都有很多小技巧,比如一个单元格中输入日期和时间,运用一些技巧就能直接将其分成日期和时间单独的两列,而无需手动修改,无疑可以节约大量的人工.下面就具体说说将表格中的日期和时间分开的三 ...

  • 红军为何能快速夺取泸定桥?兵分两路,健步如飞,22勇士视死如归

    原创蓝风破晓2021-05-03 13:04:19 每每看到红军长征,总是能激起万千感动,想想那时的年轻人,大部分都没我们读的书多,见过的各种新生事物也比我们少,但那种为事业拼搏的精神,为革命抛头颅. ...

  • 如何实现在Excel比较两列数据大小并用颜色标记

    Excel表格是大家常用来处理数据的应用程序之一,在使用表格的时候,经常会遇到各种各样的问题.最近身边就有同事问我怎么样快速地实现表格中两列数据大小进行对比,并且对小的数据自动颜色标记.如果表格数据较 ...

  • 如何计算两列数字之和?

    今天介绍一下,最简单的sum函数功效.下面是小编为大家精心整理的关于如何计算两列数字之和?希望能够帮助到你们. 方法/步骤 1单列之和---菜单法 点击开始"菜单"- " ...

  • ​{''title'':''如何计算两列数字之和?'',''content'':''

    \n 今天介绍一下,最简单的sum函数功效.下面是小编为大家精心整理的关于如何计算两列数字之和?希望能够帮助到你们. \n \n 方法/步骤 \n \n 1单列之和---菜单法 \n \n 点击开始& ...