DataFrame是由SchemaRDD发展而来,从Spark1.3.0开始SchemaRDD更名为DataFrame。不同于SchemaRDD直接继承自RDD,DataFrame自己实现了RDD的绝大多数功能。可以把Spark SQL DataFrame理解为一个分布式的Row对象的数据集合。