首页 > 试题广场 >

以下关于Spark,描述不正确的是?

[单选题]

以下关于Spark,描述不正确的是?

  • Spark是一个轻量级的内存集群计算平台,可以部署在Hadoop集群之上

  • Spark是大数据计算一站式平台,核心组件包括SparkCore、SparkSQL、SparkStreaming、MLLib和GraphX等

  • Spark不适用于偏IO的应用,如web爬虫等

  • Spark由Scala语言实现,因此只支持通过Scala进行开发

A. Spark 是一个轻量级的内存集群计算平台,可以部署在 Hadoop 集群之上 —— 正确,Spark 是一个分布式计算框架,可以在现有的 Hadoop 集群上运行,并且设计的目标是提供高性能的运算能力。 B. Spark 是大数据计算一站式平台,核心组件包括 Spark Core、Spark SQL、Spark Streaming、MLLib 和 GraphX 等 —— 正确,这些是 Spark 的主要模块,涵盖了多种数据分析场景。 C. Spark 不适用于偏 IO 的应用,如 web 爬虫等 —— 正确,虽然 Spark 可以处理大量数据,但它并不特别优化 I/O 操作,对于需要频繁读写文件的应用可能效率不高。 D. Spark 由 Scala 语言实现,因此只支持通过 Scala 进行开发 —— 错误,尽管 Spark 使用 Scala 编写,但它提供了多种编程接口,包括 Python、R 和 SQL 等,用户可以选择不同的语言进行开发。 综上所述,本题的正确答案是 D. Spark 由 Scala 语言实现,因此只支持通过 Scala 进行开发。
发表于 2024-06-27 10:43:14 回复(0)