Leetcode:h指数

📟作者主页:慢热的陕西人

🌴专栏链接:力扣刷题日记

📣欢迎各位大佬👍点赞🔥关注🚓收藏,🍉留言

文章目录

题目链接

274. H 指数 - 力扣(LeetCode)

题目描述

给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数。计算并返回该研究者的 h 指数

根据维基百科上 h 指数的定义h 代表"高引用次数" ,一名科研人员的 h 指数 是指他(她)至少发表了 h 篇论文,并且 至少h 篇论文被引用次数大于等于 h 。如果 h 有多种可能的值,h 指数 是其中最大的那个。

方法一:排序

解题思路

理解了题意以后我们可以对h数总结为如下几点:

a. 0 <= h < citations[i].size() : h数一定是小于论文数量的

b. h = min(i, 当前数组中第i大的元素):即至少h 篇论文被引用次数大于等于 h

基于上述两点我们可以先将数组排序然后遍历数组即可得到答案!

代码

C++ 复制代码
    // 自定义比较函数,用于降序排序
    bool compareDescending(int a, int b) {
        return a > b;
    }

class Solution {
public:
    int hIndex(vector<int>& citations) {
        sort(citations.begin(), citations.end(), compareDescending);
        int h = 1;
        int ret = 0;
        for(int i = 0; i < citations.size(); ++i) {
            h = min(i + 1, citations[i]);
            ret = max(h, ret);
        }
        return ret;
    }

};

复杂度分析

时间复杂度: O(nlogN),先使用了sort进行了排序,然后在遍历数组找出答案
空间复杂度: ``O(logN),由于sort的空间复杂度是O(logN)`

方法二:计数排序

解题思路

根据方法一思路我们可以理解为我们将原数组排序后再进行遍历即可,所以我们可以使用计数排序来优化,因为计数排序是一个时间复杂度为线性的排序方法!

这里的思路和方法一略有不同,首先第一个循环内是计数排序的排序过程,第二个循环内从后往前遍历计数排序的数组counter,每次将counter[i]累加起来,当tot >= i的时候则i为答案。这里的原理可以理解为tot为至少被引用i次的论文数量总和,然后i是被引用次数,当这两个值相交时就为h数。

代码

cpp 复制代码
class Solution {
public:
    int hIndex(vector<int>& citations) {
        int n = citations.size(), tot = 0;
        vector<int> counter(n + 1);
        for (int i = 0; i < n; i++) {
            if (citations[i] >= n) {
                counter[n]++;
            } else {
                counter[citations[i]]++;
            }
        }
        for (int i = n; i >= 0; i--) {
            tot += counter[i];
            if (tot >= i) {
                return i;
            }
        }
        return 0;
    }
};

复杂度分析

时间复杂度: O(N),基于计数排序的时间复杂度为O(N)
空间复杂度: O(N),计数排序的数组的长度为源数组的数据范围

方法三:二分搜索

解题思路

为什么会联想到使用二分搜索?

我们不妨换一个角度思考整个问题,基于方法1的理解我们先将原数组进行了排序,我们将citations[i]和i理解为两个函数即:
y 1 = c i t a t i o n s [ i ] , y 2 = i y_1=citations[i] ,y_2=i y1=citations[i],y2=i

然后这两个函数分别是单调递减和单调递增的,所以如果他们有交点的话那么交点处的citations[i]就是h指数(这是大多数情况下),实际实现的情况会有一些额外的情况,例如没有交点那么h指数就是论文个数总和等

代码

cpp 复制代码
class Solution {
public:
    int hIndex(vector<int>& citations) {
        if(citations.size() == 1) return citations[0] >= 1 ? 1 : 0;
        std::sort(citations.begin(), citations.end(),
                  [](int a, int b) { return a > b; });
        int right = citations.size() - 1;
        int left = 0;
        while (left < right) {
            int mid = (left + right + 1) >> 1;
            if(mid > citations[mid]) {
                right = mid - 1;
            } else if(mid < citations[mid]) {
                left = mid;
            } else {
                return citations[mid];
            }
        }
        return min(citations[left], left + 1);
    }
};

复杂度分析

时间复杂度: O(nlogN) 排序 + 二分
空间复杂度: O(1),使用了常数个额外的变量

相关推荐
爱喝雪碧的可乐28 分钟前
2026 腾讯广告算法大赛优秀方案启示:行为条件化多模态自回归生成推荐摘要
算法·数据挖掘·回归·推荐系统·推荐算法
碧海银沙音频科技研究院29 分钟前
音箱在加入 NN AEC(神经网络声学回声消除) 后出现反复重启问题解决
人工智能·深度学习·算法
叼烟扛炮2 小时前
C++ 知识点18 内部类
开发语言·c++·算法·内部类
YOGOD有神2 小时前
用AI自动从谷歌地图抓取海外客户,我跑了一次7小时的任务,结果出乎意料
算法
汉克老师2 小时前
GESP5级C++考试语法知识(十五、分治算法(二))
c++·算法·排序算法·分治算法·gesp5级·gesp五级
快瞳科技2 小时前
小样本学习在珍稀鸟类识别中的突破:仅需5张图,让AI认识濒危物种
算法
汉克老师2 小时前
GESP6级C++考试语法知识(五、格雷码)
c++·算法·位运算·异或·gesp6级·gesp六级·格雷码
Ulyanov2 小时前
《从质点到位姿:基于Python与PyVista的导弹制导控制全栈仿真》: 可视化革命——基于 PyVista 的 3D 战场构建与实时渲染
开发语言·python·算法·3d·系统仿真
,,?!,2 小时前
数据结构算法-排序算法
数据结构·算法·排序算法
小白编程锤炼3 小时前
深入解析:质量门禁
人工智能·算法·架构·vibe-coding