Lodash源码阅读-sortedUniqBy

Lodash 源码阅读-sortedUniqBy

sortedUniqBy 是 Lodash 中的一个数组去重函数，专门为已排序数组设计并优化。与普通的 uniqBy 不同，它利用数组已排序的特性，使用更高效的算法进行去重操作。该函数接受一个可选的迭代器参数，可以在比较元素前对元素进行转换，最终返回一个新的无重复元素的数组。

javascript 复制代码

function sortedUniqBy(array, iteratee) {
  return array && array.length
    ? baseSortedUniq(array, getIteratee(iteratee, 2))
    : [];
}

sortedUniqBy 函数实现非常简洁，主要分为以下几个步骤：

相比于普通的 uniqBy，sortedUniqBy 针对已排序数组做了特殊优化。由于排序数组中重复元素总是相邻的，所以只需要与前一个转换后的值比较，而不需要与所有已见过的值比较，这大大提高了性能。

javascript 复制代码

function sortedUniqBy(array, iteratee) {

函数接收两个参数：

javascript 复制代码

return array && array.length
  ? baseSortedUniq(array, getIteratee(iteratee, 2))
  : [];

这一行代码首先检查 array 是否为有效数组（存在且有长度）：

javascript 复制代码

getIteratee(iteratee, 2);

getIteratee 函数用于处理各种类型的迭代器参数，确保返回标准的函数形式：

baseSortedUniq 函数通过一次遍历实现去重，主要利用排序数组的一个关键特性：相同的元素在排序后必然相邻。因此，只需要将当前元素与前一个元素比较，如果不相同则加入结果数组。

这种方法比通用的 uniq 更高效，因为它只需要 O(n) 的时间复杂度，而不需要使用哈希表或者多次比较。

sortedUniqBy 是一个为已排序数组专门设计的去重函数，它巧妙地利用了排序数组中重复元素相邻的特性，实现了线性时间复杂度的去重操作，比通用的去重函数更高效。

主要特点和优势：

在处理大型已排序数据集时，sortedUniqBy 比通用的 uniqBy 更为高效，是数据去重的优选工具。