vlambda博客
学习文章列表

「大数据」(八十六)Scala基础

【导读:数据是二十一世纪的石油,蕴含巨大价值,这是·情报通·大数据技术系列第[86]篇文章,欢迎阅读和收藏】

1 基本概念

Scala 是基于 Java 虚拟机即 JVM 的一门编程语言。所有 Scala 的代码,都需要经过编译为字节码,然后交由 Java 虚拟机来运行。Scala 可以任意调用 Java 的代码, Scala 源代码被编译成 Java 字节码,并可以调用现有的 Java 类库。


2 术语解释

Scala 是一门多范式( multi-paradigm )的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。

3 Scala 特性

面向对象特性

Scala 是一种纯面向对象的语言,每个值都是对象。对象的数据类型以及行为由类和特质描述。

类抽象机制的扩展有两种途径:一种途径是子类继承,另一种途径是灵活的混入机制。这两种途径能避免多重继承的种种问题

函数式编程

Scala 也是一种函数式语言,其函数也能当成值来使用。

更进一步,程序员可以利用 Scala 的模式匹配,编写类似正则表达式的代码处理 XML 数据。

静态类型

Scala 具备类型系统,通过编译时检查,保证代码的安全性和一致性。类型系统具体支持以下特性:

(1) 泛型类

(2) 协变和逆变

(3) 标注

(4) 类型参数的上下限约束

(5) 把类别和抽象类型作为对象成员

(6) 复合类型

(7) 引用自己时显式指定类型

(8) 视图

(9) 多态方法

扩展性

Scala 的设计秉承一项事实,即在实践中,某个领域特定的应用程序开发往往需要特定于该领域的语言扩展。Scala 提供了许多独特的语言机制,可以以库的形式轻易无缝添加新的语言结构:

(1) 任何方法可用作前缀或后缀操作符

(2) 可以根据预期类型自动构造闭包。

并发性

Scala 使用 Actor 作为其并发模型, Actor 是类似线程的实体,通过邮箱发收消息。Actor 可以复用线程,因此可以在程序中可以使用数百万个 Actor, 而线程只能创建数千个。在 2.10 之后的版本中,使用 Akka 作为其默认 Actor 实现。

4 为什么要学Scala

1、优雅:这是框架设计师第一个要考虑的问题,框架的用户是应用开发程序员,API是否优雅直接影响用户体验。


2、速度快:Scala语言表达能力强,一行代码抵得上Java多行,开发速度快;Scala是静态编译的,所以和JRuby,Groovy比起来速度会快很多。


3、能融合到Hadoop生态圈:Hadoop现在是大数据事实标准,Spark并不是要取代Hadoop,而是要完善Hadoop生态。JVM语言大部分可能会想到Java,但Java做出来的API太丑,或者想实现一个优雅的API太费劲。