首页 > 试题广场 >

在数据预处理阶段,如何处理浮动数据的单位不一致问题?

[单选题]
在数据预处理阶段,如何处理浮动数据的单位不一致问题?
  • 随意选择单位
  • 统一为同一单位
  • 删除所有数据
  • 不需要处理

在实际数据集中,同一物理量(如长度、重量、温度、速度等)可能以不同单位记录。例如:

  • 身高:有的记录为厘米(cm),有的为米(m);
  • 重量:有的用千克(kg),有的用磅(lbs);
  • 温度:摄氏度(℃)与华氏度(℉)混用。

如果不统一单位,会导致:

  • 模型学习到错误的模式(例如认为“180”比“1.8”大100倍,而其实都是身高);
  • 特征尺度差异过大,影响模型收敛和性能;
  • 预测结果不可靠甚至完全错误

因此,在数据预处理阶段,必须将同一物理量的数值转换为统一的单位(如全部转为米、千克、摄氏度等),这是数据标准化和清洗的重要环节。

发表于 2025-12-19 09:10:51 回复(0)