본문 바로가기

spark

[spark] dataframe get row value 데이터 전처리

원하는 특정 열 (쿼리로 치면 where절)

getRowDf = df.filter("col_name = 'value'")

 

원하는 특정 칼럼들

getColDf = df.select("col1","col2")

 

for row in df.rdd.collect():

  print(rolw)

'spark' 카테고리의 다른 글

[spark dataframe] extract date value using pyspark udf lambda  (0) 2021.12.27
[pyspark] create spark dataframe  (0) 2020.07.10