题目链接
英文链接:https://leetcode.com/problems/find-median-from-data-stream/
中文链接:https://leetcode-cn.com/problems/find-median-from-data-stream/
题目详述
中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:
1 | addNum(1) |
进阶:
- 如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
- 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
题目详解
- 建立一个大根堆和一个小根堆。大根堆存储小于等于当前中位数的数,小根堆存储大于等于当前中位数的数,且维持大根堆的元素个数比小根堆的元素个数多 1 个或相等。
- 这样,当数据流元素个数为奇数时,中位数就是大根堆堆顶元素;当数据流元素个数为偶数时,中位数就是大根堆堆顶元素与小根堆堆顶元素的平均值。
- 当添加元素时,如果当前元素小于等于大根堆堆顶元素,就添加到大根堆;否则添加到小根堆。同时要维护两个堆的元素个数的约束关系。
1 | public class LeetCode_00295 { |
进阶:
- 运用一个数组和一个变量。数组长度为 101,用来存储每个元素出现的次数;变量用来记录有多少个元素。查找中位数遍历数组即可,时间复杂度为
O(100)
,即O(1)
。 - 99% 的整数都在 0 到 100 范围内,说明中位数仍旧在 0 到 100 范围内。在 1 的基础上增加两个变量,一个用来记录小于 0 的元素的出现次数,另一个用来记录大于 100 元素的出现次数。查找中位数仍旧是遍历数组,只需要改变一下判断条件。时间复杂度为
O(1)
。