LeetCode295-数据流的中位数

题目链接

英文链接:https://leetcode.com/problems/find-median-from-data-stream/

中文链接:https://leetcode-cn.com/problems/find-median-from-data-stream/

题目详述

中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:

1
2
3
4
5
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2

进阶:

  1. 如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
  2. 如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?

题目详解

  • 建立一个大根堆和一个小根堆。大根堆存储小于等于当前中位数的数,小根堆存储大于等于当前中位数的数,且维持大根堆的元素个数比小根堆的元素个数多 1 个或相等。
  • 这样,当数据流元素个数为奇数时,中位数就是大根堆堆顶元素;当数据流元素个数为偶数时,中位数就是大根堆堆顶元素与小根堆堆顶元素的平均值。
  • 当添加元素时,如果当前元素小于等于大根堆堆顶元素,就添加到大根堆;否则添加到小根堆。同时要维护两个堆的元素个数的约束关系。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
public class LeetCode_00295 {

class MedianFinder {

private Queue<Integer> small;
private Queue<Integer> large;

/** initialize your data structure here. */
public MedianFinder() {
small = new PriorityQueue<>(Comparator.reverseOrder());
large = new PriorityQueue<>();
}

public void addNum(int num) {
if (small.isEmpty() || num <= small.peek()) {
small.offer(num);
if (small.size() > large.size() + 1) {
large.offer(small.poll());
}
} else {
large.offer(num);
if (large.size() > small.size()) {
small.offer(large.poll());
}
}
}

public double findMedian() {
if (small.size() == large.size()) {
return ((double) small.peek() + large.peek()) / 2;
} else {
return small.peek();
}
}
}
}

进阶:

  1. 运用一个数组和一个变量。数组长度为 101,用来存储每个元素出现的次数;变量用来记录有多少个元素。查找中位数遍历数组即可,时间复杂度为 O(100),即 O(1)
  2. 99% 的整数都在 0 到 100 范围内,说明中位数仍旧在 0 到 100 范围内。在 1 的基础上增加两个变量,一个用来记录小于 0 的元素的出现次数,另一个用来记录大于 100 元素的出现次数。查找中位数仍旧是遍历数组,只需要改变一下判断条件。时间复杂度为 O(1)