RIDI Style Guide

Spark 개발 가이드

Spark Application 개발은 scala 사용을 원칙으로 한다.

Scala Style Guides

스칼라 코딩 스타일은 Scala 코딩 스타일 가이드를 참조한다.

Naming

Variables

Application

Chained Method Invocations

outputDF.write.format(“parquet”).mode(SaveMode.Overwrite).saveAsTable(output)

outputDF.write .format(“parquet”) .mode(SaveMode.Overwrite) .saveAsTable(output)

outputDF.write.format(“parquet”) .mode(SaveMode.Overwrite) .saveAsTable(output)

// don’t do these outputDF.write.format(“parquet”).mode(SaveMode.Overwrite) .saveAsTable(output)

outputDF.write .format(“parquet”).mode(SaveMode.Overwrite) .saveAsTable(output)


## Spark SQL
- 쿼리문이 간결하고 짧은 경우 singleline string 사용
```scala
val teenagerNameDS = spark.sql("SELECT name FROM people WHERE age BETWEEN 13 AND 19").as[Name]

RDD vs Spark SQL, Dataset, DataFrame API

참고문서