vlambda博客
学习文章列表

大数据入门:Java和Scala编程对比

在学习大数据之初,很多人都会对编程语言的学习有疑问,比如说大数据编程主要用什么语言,在实际运用当中,大数据主流编程是Java,但是涉及到Spark、Kafka框架,还需要懂Scala。今天的大数据入门分享,我们就来对Java和Scala这两门语言的编程做个对比。


Java VS Scala

从定义上来说,Java是面向对象的编程语言,而Scala是函数式编程语言,这两门语言之间,本身也有一定的关联。

Scala来源于Java,又“高于”Java,在Java之上增加了一层编码的“API”,让程序员可以通过函数式编程的方式来开发程序。

Scala程序最终被编译为.class文件运行在JVM虚拟机中,所以它是JVM下的语言一种,在实际的大数据开发任务当中,Java和Scala都运行于JVM之上,也能更好地集成。

Scala语言在大数据场景下,大多数是用来构建处理数据的。作为开发者,只需要关注收到的数据是什么格式,要把收到的数据分类映射成什么格式,映射后的数据接下来又如何映射成我所需要的数据集(常用的数据集有TopN,Accumulator等)。

大数据入门:Java和Scala编程对比


Java和Scala的区别

1、变量声明

var变量;val常量;Scala支持自动类型推断

Scala更多的是采用常量,而不是变量来解决问题,这样带来的好处是可以减少多线程并发安全问题,特别适合高并发分布式的场景。

2、函数的声明

关键字def,Scala函数没有返回值时使用Unit,相当于Java的void。

Scala支持函数式编程,可以使用高阶函数,函数是一等公民。

3、基本类型

Scala中没有真正意义上的基本类型,类型都是类。

4、静态

Java中静态static是违背Java OOP编程思想和封装特性。

Scala取消了静态的概念,使用了单例对象Object来实现。

5、字符串

Scala支持使用字符串插值的方式对字符串进行格式化,使用$开头进行取值。

另外支持使用三引号将其中的内容直接包起来(Python也有三引号),其中可以包括任何字符,而不需要进行特别转义。


6、类

Scala类中的字段自动带有getter和setter方法,另外可以使用@BeanProperty注解来生成Java中的Get/Set方法。

Scala中的每个类都有一个主构造方法,这个构造方法和类定义“交织在一起”,类的参数直接成为类的字段,主构造方法执行类体中的所有语句。

7、Scala中不支持break

使用return替代

在循环中使用if和布尔类型变量

导入Java中支持break的包

8、访问范围

Java中外部看不到内部,内部能看到外部

Scala中外部看不到内部,内部也看不到外部

9、通配符

Java中使用*进行通配

Scala中使用_进行通配

10、默认导入的类

Scala默认java.lang包、Scala包、Scala.Predef类

Java默认导入java.lang包

11、特质trait可以类比Java中的接口,但是和接口非常不一样

Java中称为类实现了接口,Scala中称为混入了特质

和Java中的接口不同,Scala中的特质可以包含带有方法体的方法(JDK8接口也可以的,比如default方法)。

关于大数据入门,Java和Scala编程,以上就为大家做了简单的对比了。在大数据开发任务当中,Java语言和Scala语言都在各自的场景下发挥着作用,而Scala的学习,对于Spark框架的掌握尤其重要。


加米谷学院系成都加米谷大数据科技有限公司旗下教育品牌。是一家专注于大数据人才培养的机构。由来自阿里、华为、京东、星环等国内知名企业的多位技术大牛联合创办,技术底蕴丰厚,勤奋创新,精通主流前沿大数据及人工智能相关技术。面向社会提供大数据、人工智能等前沿技术的技能提升业务。



成都加米谷学院

个人技能提升 丨 企业内训提升

成都高新区吉泰一街国际科技节能大厦B座23层