Viết ứng dụng Word Count trên Spark bằng Scala, sử dụng Intellij IDEA Community

Ở bài mở đầu, tui đã hướng dẫn cài đặt Spark 1.6.3 trên Windows 10 rồi. Trong bài này, tui thử viết một ứng dụng chạy trong môi trường Spark bằng ngôn ngữ Scala với IDE Intellij IDEA phiên bản Community.

Đối với Spark, các bạn có thể viết ứng dụng bằng 4 ngôn ngữ: Scala, Java, Python, R. Nhưng tui lại thích chọn Scala bởi vì:

  • Spark được build bằng Scala
  • Đã từng làm qua Java, C#, nhưng lại thích kiểu lập trình không cần khai báo datatype như PHP mà Spark không hổ trợ PHP cho nên quyết định dùng Scala bởi Scala có cú pháp gần giống Java mà lại không cần khai báo datatype giống PHP

Đó là ý kiến cá nhân của tui thôi, còn các bạn thích ngôn ngữ nào trong 3 cái còn lại thì cứ dùng nó, chả ảnh hưởng ai cả đâu.

(more…)

Read More