如何转置RDD或MLLib矩阵

技术如何将RDD或者MLLib矩阵进行转置操作如何将RDD或者MLLib矩阵进行转置操作,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。如何将

如何转置RDD或MLLib矩阵,很多新手都不是很清楚。为了帮助大家解决这个问题,下面小编就详细讲解一下。需要的人可以从中学习,希望你能有所收获。

如何转置Spark Mllib或一个RDD的矩阵。Spark Mllib的矩阵有多种形式,分布式的和非分布式的,非分布式的矩阵这里就不提了,因为是基于数组的,所以很简单。虽然分布式存储是基于RDD的,但问题变成了如何转置RDD。

首先,我们来介绍一下什么是转置运算:

根据百科中的定义,交换矩阵的行和列得到的矩阵就是矩阵的转置。

如果要交换一个RDD的军衔,主要思路如下:

1、首先变换RDD,并给每行一个唯一的行号(row,rowIndex)。

2.对于RDD的每一行,它都被转换为(value,colindex)并排序为(colIndex)。tolong,(rowindex,value))

3.执行平面图

4.完成第3步后,我们只需要按照3key分组,按照它的键排序,就可以得到转换后的列顺序。

5.步骤4完成后,我们可以根据每行的rowIndex,value)构造带有下标及其值的新行,从而保证转换后每行的顺序。

到的转换完成。

具体步骤如下:

def transposserowmatrix(m :行矩阵):行矩阵={ 0

val transposedRowsRDD=m . rows . zippwithindex . map { case(row,row index)=row totransposedtriplet(row,rowIndex)}。flat map(x=x)//(new rownindex,(newColIndex,value))。groupByKey。sortByKey()。map(_。_2) //对行进行排序并删除索引。映射(buildRow) //使用索引和值重新构建每一行,并删除索引。

新行矩阵

}

//转换每一行

def rowtortransposedtriplet(row : Vector,rowIndex: Long):数组[(Long,(Long,Double))]={ 0

val index edrow=row . to array . zipcwithindex

indexedRow.map{case (value,colIndex)=(colIndex.toLong,(rowIndex,value))}

}

//创建新行

def buildRow(row withindex : Iterable[(Long,Double)]): Vector={ 0

val resArr=新数组[双精度]

rowWithIndexes.foreach{case(索引,值)=

resArr(index.toInt)=值

}

vectors . density(ReSarr)

}测试

准备数据

val观测值=sc.parallelize(

Seq(

vectors . density(1.0,10.0,100.0,2.0),

向量.密集(2.0,20.0,200.0,2.0),

向量.密集(3.0,30.0,300.0,2.0)

)

)生成矩阵

valmat :行矩阵=新行矩阵(观察)如何将RDD或者MLLib矩阵进行转置操作

你会发现军衔已经互换了。

阅读以上内容对你有帮助吗?如果您想了解更多相关知识或阅读更多相关文章,请关注行业资讯频道,感谢您的支持。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/154318.html

(0)

相关推荐

  • 造纸术是哪个朝代发明的,纸的发明经历了哪四个时间段

    技术造纸术是哪个朝代发明的,纸的发明经历了哪四个时间段上古时代祖先主要依靠结绳记事,以后渐渐发明了文字,开始用甲骨来作为书写材料。后来又发现和利用竹片和木片(即简牍)以及缣帛作为书写材料。但由于缣帛太昂贵,竹木太笨重,于

    生活 2021年10月30日
  • 泰山海拔高度,泰山的主峰到底有多高啊

    技术泰山海拔高度,泰山的主峰到底有多高啊泰山的主峰是玉皇顶泰山海拔高度,高度海拔1532.7米。玉皇顶,是泰山主峰之巅,因峰顶有玉皇庙而得名。玉皇顶旧称太平顶,又名天柱峰,始建年代无考,明成化年间重修。神龛上匾额题“柴望

    生活 2021年10月22日
  • 微信小程序修改checkbox的样式代码怎么写

    技术微信小程序修改checkbox的样式代码怎么写这篇文章将为大家详细讲解有关微信小程序修改checkbox的样式代码怎么写,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

    攻略 2021年11月16日
  • 怎么实现RabbitMQ消息中间件的工作原理和使用

    技术怎么实现RabbitMQ消息中间件的工作原理和使用这篇文章将为大家详细讲解有关怎么实现RabbitMQ消息中间件的工作原理和使用,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定

    攻略 2021年12月3日
  • nh4电子式,电子式要怎么写,和离子式的区别?

    技术nh4电子式,电子式要怎么写,和离子式的区别?电子式一般针对单个的分子或原子出题,让你写出他们的电子式,即各自外部电子的分布或排布情况nh4电子式。离子式一般用在写离子方程式上,离子即物质溶于水后所形成的粒子,比如说

    生活 2021年10月20日
  • 电动势的定义,电动势的定义式和决定式

    技术电动势的定义,电动势的定义式和决定式电动势的定义式及物理意义在电源内部,非静电力所做的功W与被移送的电荷q的比值叫电源的电动势电动势的定义。
    定义式:E=W/q
    物理意义:表示电源把其它形式的能(非静电力做功)转化为

    生活 2021年10月22日