请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

请问老师,两个不同长度的样本如何比较相似度?

问题是这样的:
A和B都是数字9的数据,里面包含绘制9这个数字的(x,y)坐标。

A = [(142, 151),(154, 89),(215, 35),(266, 35),(307, 32),(337, 54),(368, 73),(408, 137),(422, 191),(428, 217),(432, 245),(435, 276),(435, 300),(434, 333),(409, 276),(360, 249),(315, 225),(259, 215),(168, 223),(43, 354),(43, 462),(43, 574),(173, 710),(273, 710),(343, 710),(463, 633),(524, 489),(524, 371),(524, 214),(486, 131),(464, 49),(403, 5),(333, -49),(262, -39),(175, -43),(122, 9),(67, 57),(56, 144),(425, 457),(425, 530),(383, 590),(341, 635),(284, 635),(223, 635),(168, 586),(135, 539),(144, 459),(135, 387),(177, 335),(220, 301),(297, 301),(344, 301),(384, 355),(425, 391),(412, 460)]
B = [(142, 151), (160, 85), (184, 62), (220, 35), (253, 35), (307, 35), (337, 57), (368, 73), (408, 137), (422, 191), (428, 217), (435, 273), (435, 300), (435, 308), (435, 313), (434, 319), (409, 276), (360, 249), (315, 223), (259, 223), (168, 223), (105, 275), (43, 354), (43, 462), (43, 574), (173, 710), (273, 710), (343, 710), (404, 671), (463, 633), (480, 562), (524, 489), (524, 356), (524, 214), (494, 131), (464, 53), (418, -8), (351, -39), (253, -39), (175, -39), (122, 9), (67, 57), (56, 144), (430, 472), (425, 544), (341, 635), (284, 635), (223, 635), (179, 586), (146, 539), (135, 459), (148, 390), (177, 345), (220, 301), (282, 313), (344, 301), (425, 391), (425, 466)]

然后绘制出来是长这个样子的:
图片描述
两个样本长度不一样,而且每个点都会有一点偏移,请问这种我应该如何去识别它?

正在回答

1回答

机器学习算法要求每个样本比较的维度是相同的。对于维度不同的数据,必须使用特征处理技术,将他们化为同维度的数据。具体怎么化,不同领域,不同数据,有不同的方法。


比如,最典型的,图像领域,识别两张分辨率不同的照片,首先需要将两张照片化为同分辨率。或者将大图像化成小图像,所以有了各种图像压缩算法;或者将小图像化成大图像,所以有了各种插值算法。这些工作都在特征工程的篮子里。所以说,做机器学习,特征工程特别重要。是一个巨大的前提。


至于你处理的这个问题,应该怎么做数据维度的对齐,我也不了解,可以在你所在的领域深挖一下,或者在相关领域的社区进行讨论交流。


继续加油!:)

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信