development

팬더 데이터 프레임의 인덱스를 열로 변환하는 방법은 무엇입니까?

big-blog 2020. 2. 29. 15:27
반응형

팬더 데이터 프레임의 인덱스를 열로 변환하는 방법은 무엇입니까?


이것은 다소 분명해 보이지만 데이터 프레임의 인덱스를 열로 변환하는 방법을 알 수없는 것 같습니다.

예를 들면 다음과 같습니다.

df=
        gi       ptt_loc
 0  384444683      593  
 1  384444684      594 
 2  384444686      596  

에,

df=
    index1    gi       ptt_loc
 0  0     384444683      593  
 1  1     384444684      594 
 2  2     384444686      596  

어느 한 쪽:

df['index1'] = df.index

또는 .reset_index:

df.reset_index(level=0, inplace=True)

따라서 다음과 같이 3 단계의 색인이있는 다중 색인 프레임이있는 경우

>>> df
                       val
tick       tag obs        
2016-02-26 C   2    0.0139
2016-02-27 A   2    0.5577
2016-02-28 C   6    0.0303

색인 의 첫 번째 ( tick) 및 세 번째 ( obs) 수준을 열로 변환하려면 다음을 수행하십시오.

>>> df.reset_index(level=['tick', 'obs'])
          tick  obs     val
tag                        
C   2016-02-26    2  0.0139
A   2016-02-27    2  0.5577
C   2016-02-28    6  0.0303

MultiIndex의 경우 다음을 사용하여 하위 인덱스를 추출 할 수 있습니다

df['si_name'] = R.index.get_level_values('si_name') 

여기서 si_name하위 색인의 이름입니다.


좀 더 명확하게하기 위해 인덱스에 두 개의 레벨 (MultiIndex)이있는 DataFrame을 살펴 보겠습니다.

index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'], 
                                    ['North', 'South']], 
                                   names=['State', 'Direction'])

df = pd.DataFrame(index=index, 
                  data=np.random.randint(0, 10, (6,4)), 
                  columns=list('abcd'))

여기에 이미지 설명을 입력하십시오

reset_index기본 매개 변수와 함께 호출 된 메소드는 모든 색인 레벨을 열로 변환하고 단순 RangeIndex을 새 색인으로 사용합니다 .

df.reset_index()

여기에 이미지 설명을 입력하십시오

level매개 변수를 사용하여 열로 변환 할 인덱스 레벨을 제어 하십시오 . 가능하면 레벨 이름을 사용하십시오. 레벨 이름이 없으면 외부에서 0부터 시작하는 정수 위치로 각 레벨을 참조 할 수 있습니다. 여기에 스칼라 값 또는 재설정하려는 모든 인덱스 목록을 사용할 수 있습니다.

df.reset_index(level='State') # same as df.reset_index(level=0)

여기에 이미지 설명을 입력하십시오

드문 경우지만 인덱스를 유지하고 인덱스를 열로 바꾸려는 경우 다음을 수행 할 수 있습니다.

# for a single level
df.assign(State=df.index.get_level_values('State'))

# for all levels
df.assign(**df.index.to_frame())

rename_axis + reset_index

먼저 색인 이름을 원하는 레이블로 바꾼 다음 시리즈 승격 할 수 있습니다.

df = df.rename_axis('index1').reset_index()

print(df)

   index1         gi  ptt_loc
0       0  384444683      593
1       1  384444684      594
2       2  384444686      596

이것은 MultiIndex데이터 프레임 에도 적용됩니다 .

print(df)
#                        val
# tick       tag obs        
# 2016-02-26 C   2    0.0139
# 2016-02-27 A   2    0.5577
# 2016-02-28 C   6    0.0303

df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()

print(df)

       index1 index2  index3     val
0  2016-02-26      C       2  0.0139
1  2016-02-27      A       2  0.5577
2  2016-02-28      C       6  0.0303

reset_index방법 을 사용하고 기존 색인을 유지하려면 다음을 사용해야합니다.

df.reset_index().set_index('index', drop=False)

또는 그것을 바꾸려면 :

df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)

예를 들면 다음과 같습니다.

print(df)
          gi  ptt_loc
0  384444683      593
4  384444684      594
9  384444686      596

print(df.reset_index())
   index         gi  ptt_loc
0      0  384444683      593
1      4  384444684      594
2      9  384444686      596

print(df.reset_index().set_index('index', drop=False))
       index         gi  ptt_loc
index
0          0  384444683      593
4          4  384444684      594
9          9  384444686      596

색인 레이블을 제거하려면 다음을 수행하십시오.

df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
   index         gi  ptt_loc
0      0  384444683      593
4      4  384444684      594
9      9  384444686      596

df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1

    new     gi     ptt
0    0      232    342
1    1      66     56 
2    2      34     662
3    3      43     123

참고 URL : https://stackoverflow.com/questions/20461165/how-to-convert-index-of-a-pandas-dataframe-into-a-column



반응형