First commit

This commit is contained in:
thematdev 2021-08-27 13:13:28 +03:00
commit 4c4ee1ee8e
2 changed files with 211 additions and 0 deletions

7
linear_nt/config.json Normal file
View File

@ -0,0 +1,7 @@
{
"standalone": false,
"template": "basic_template.html",
"credits": [
"Никифор Кузнецов"
]
}

204
linear_nt/main.md Normal file
View File

@ -0,0 +1,204 @@
# Линейные алгоритмы в теории чисел
Зачастую в теории чисел сложно сказать что-то про одно число, а про несколько значительно проще.
Так, например, до [недавнего времени](https://en.wikipedia.org/wiki/AKS_primality_test) человечеству не было
известно, как определить, является ли число простым за полиномиальное время, а найти все простые числа от $1$ до $N$
можно решетом Эратосфена, и даже за линейное время.
Также неизвестна содержательная оценка сверху количества делителей числа, но известна практически точная оценка для суммы
количества делителей по всем числам от $1$ до $N$
**Важное замечание:** далее во всех асимптотиках алгоритмов мы считаем количество арифметических операций. Иначе говоря, мы не берем во внимание, сколько выполняется операция умножения или деления, взятия по модулю.
## Результаты аналитической теории чисел
Которые, мы, однако, доказывать не будем, но будем активно использовать.
**Вторая теорема Мертенса**. $$\sum\limits_{p \leqslant n, p \text{ -- простое}} \frac{1}{p} = \log \log n + C + o(1)$$
Доказательство более слабого утверждения можно найти
[здесь](https://math.stackexchange.com/questions/2678885/easy-proof-of-a-weak-form-of-mertenss-second-theorem)
Некоторые из её следствий, которыми мы будем пользоваться:
* $\sum\limits_{x \leqslant n} \omega(x) = n \log \log n + C_1n + o(n)$, где $\omega(n)$ -- количество различных простых делителей
* $\sum\limits_{x \leqslant n} \Omega(x) = n \log \log n + C_2n + o(n)$, где $\Omega(n)$ -- количество простых делителей в разложении
На сумму количества делителей известна следующая оценка: $\sum\limits_{x \leqslant n} \sigma_0(x) = n \log n + Cn + O\left(\sqrt{n}\right)$.
## Решето Эратосфена
Самый простой вариант решета Эратосфена заключается в том, что мы берём каждое число от $2$ до $N$, и "просеиваем" им, то есть помечаем
все числа, которые на него делятся как составные. Его псевдо-реализация:
``` {.c}
for (int i = 2; i <= N; i++) {
for (int k = 2; i * k <= N; k++) {
primes[i * k] = false;
}
}
```
Нетрудно оценить его время работы. Когда мы просеваем числом $i$, мы делаем $\frac{N}{i}$ операций, то есть суммарно
$\frac{N}{1} + \frac{N}{2} + \ldots + \frac{N}{N} = N \left(1 + \frac{1}{2} + \ldots + \frac{1}{N}\right)$,
что легко оценивается сверху как $O(N \log N)$ суммой гармонического ряда.
Перед нами встаёт вопрос, как улучшить наш алгоритм. Первое, что приходит в голову, просеивать только числами до $\sqrt{N}$, потому что
если число $x \leqslant N$ делится на $k \geqslant \sqrt{N}$, то оно делится на $\frac{d}{k} \leqslant \sqrt{N}$.
Однако, это никак не улучшает асимптотику, поскольку $\log \left(\sqrt{N}\right) = \frac{1}{2} \log N$.
Ещё одна идея -- просеивать только простыми числами, то есть теми, которыми алгоритм ещё не пометил. И, оказывается, что эта идея
улучшает асимптотику до $O(N \log \log N)$. Действительно, теперь мы делаем
$\sum\limits_{p \leqslant N} \frac{N}{p}$ операций, где $p$ -- простые
числа. Из второй теоремы Мертенса это и есть $O(N \log \log N)$.
### Линейное решето Эратосфена
Решим более общую задачу. Найдём для каждого числа от $1$ до $N$ его наименьший делитель, а также будем поддерживать список
уже найденных простых чисел.
Рассмотрим следующий алгоритм, на $i$-ом шаге которого мы:
1. Если наименьший делитель числа $i$ не был найден до этого, добавляем $i$ в список простых.
2. Для всех простых чисел $p$, не больших $q$, наименьшего делителя $i$, объявляем наименьшим делителем числа $pi$ число $p$.
Его псевдо-реализация:
``` {.c}
for (int i = 2; i <= N; i++) {
if (lowest_divisor[i] == 0) {
primes.push_back(i);
lowest_divisor[i] = i;
}
for (int prime : primes) {
if (prime * i > N || prime > lowest_divisor[i]) {
break;
}
lowest_divisor[i * prime] = prime;
}
}
```
Докажем корректность алгоритма, а именно, что на $i$-ом шаге корректно посчитаны все наименьшие делители чисел, не превосходящих $i$
, а также найдены все простые числа не превосходящие $i$ по индукции.
База очевидна.
Переход. Пусть до числа $i$ утверждение выполнено.
Если число $i$ -- простое, то ни на каком прошлом шаге $j$ не нашлось бы число $p$, что $jp = i$,
значит мы добавим его в список простых, и объявим его наименьшим делителем $i$, что и требовалось.
Если число $i$ -- составное, тогда его наименьшим делителем является простое число, обозначим его за $p$.
Наименьший делитель числа $\frac{i}{p}$ не меньше $p$ из выбора $p$. Значит, на шаге с номером $\frac{i}{p}$ мы объявили наименьшим делителем
$i$ число $p$.
Пусть наименьший делитель $i$ обновлялся ещё и на шаге $j \neq \frac{i}{p}$. Тогда $jq = i$, причём $q \neq p$ -- простое. Пусть
* $q < p$. Тогда у числа $i$ есть делитель, меньший $p$, а именно $q$. Противоречие.
* $q > p$. Тогда у числа $j = \frac{i}{q}$ наименьший делитель равен $p < q$, а значит мы бы не обновляли ответ для $i$ на шаге $j$. Противоречие.
Значит, алгоритм корректно находит наименьший общий делитель всех чисел от $1$ до $N$, причём в процессе каждому числу присваивался
наименьший делитель ровно один раз.
Значит, наш алгоритм работает за линейное время.
## Вычисление значений мультипликативной функции $f$ для всех чисел от $1$ до $N$ за $O(N)$
Будем считать, что наименьшие делители всех чисел уже посчитаны до этого за $O(N)$.
Единственное требование к функции $f$ -- умение по простому числу $p$ и числу $k$
вычислять $f(p^k)$ за $O(k)$.
Так, например при $f = \varphi$, функции Эйлера, $f(p^k) = p^{k - 1} \cdot (p - 1)$.
Заметим, что $f(n) = f(\frac{n}{p^k}) \cdot f(p^k)$, где $p$ -- наименьший делитель $n$, а $d(n) = k$ -- его степень
вхождения
Из мультипликативности $f(ab) = f(a) \cdot f(b)$ если $\gcd(a, b) = 1$, а $\gcd(p^k, \frac{n}{p^k}) = 1$ из опредения $p^k$.
Откуда вытекает следующий алгоритм, на $i$-ом шаге которого мы:
1. Считаем для данного $i$ его $p^k$ за $O(d(i))$: делим на наименьший делитель, пока он не меняется.
2. Если $p^k = i$, считаем $f(p^k)$ за $O(d(i))$ или за $O(1)$, что и будет ответом для числа $i$.
3. Иначе объявляем $f(i)$ равным $f(p^k) \cdot f(\frac{n}{p^k})$, вычисляя это выражение за $O(1)$, поскольку оно
использует только значения $f$ для аргументов меньших $i$, для которых всё уже посчитано.
Итоговая сложность алгоритма составляет $O\left( \sum\limits_{i \leqslant N} d(i) \right)$ времени и $O(N)$ памяти.
**Основная лемма.** $\sum\limits_{i \leqslant N} d(i) = \Theta(N)$.
Пусть $n = p_1^{\alpha_1} \cdot \ldots p_k^{\alpha_k}$. Тогда
$d(n) \leqslant 1 + (\alpha_1 - 1) + \ldots + (\alpha_k - 1) = 1 + \Omega(n) - \omega(n)$.
Откуда из теорем в начале для исходной суммы выполнена оценка:
$$N + \sum\limits_{x \leqslant N} \Omega(x) - \sum\limits_{x \leqslant N} \omega(x) = N + (C_2 - C_1)N + o(N) = O(N)$$
Что и требовалось. То есть на самом деле наш алгоритм линейный, и даже с очень неплохой константой. Также
он требует всего $2N$ памяти, не считая списка простых(его можно не хранить после вычисления наименьших делителей).
Его можно применять для нахождения функции Мёбиуса, Эйлера, количества делителей, суммы делителей, и так далее.
Также стоит отметить, что можно было просто предподсчитать $d(i)$ для всех чисел за $O(N)$
потратив ещё $N$ памяти.
Ценность данной техники в том, что она позволяет сэкономить память, а также решать задачу почти в общем случае, даже
когда считать $f$ для степени простого очень сложно.
### Реализация
Ниже приведена реализация на языке C++
``` {.c}
// ld -- наименьший делитель числа, предпосчитан линейным решетом
// fs -- список значений функции f для чисел от $1$ до $N$
// Также можно возвращать, например не $k$, а $p^k$ или пару $(k, p^k)$, чтобы не считать дважды
int d(int n) {
if (n == 1) {
return 1;
}
int p = ld[n];
int ans = 1;
while (ld[n / p] == p) {
ans += 1;
n /= p;
}
return ans;
}
int f(int p, int k) {
// Результат функции для p^k
// В качестве примера возьмём функцию Эйлера
int ans = (p - 1);
for (int i = 0; i < k - 1; i++) {
ans *= p;
}
}
void calculate(int N) {
fs[1] = 1;
for (int i = 2; i <= N; i++) {
int k = d(i), p = ld[i];
int pk = 1; // $p^k$
for (int j = 0; j < k; j++) {
pk *= p;
}
if (pk == i) {
fs[i] = f(p, k);
} else {
fs[i] = fs[i / pk] * fs[pk]
}
}
}
```
## Полезные ссылки и источники
* [Оригинальное доказательство основной леммы](https://math.stackexchange.com/questions/3886140/upper-bound-of-sum-of-powers-of-lowest-divisors)
* [Hardy-Wright: An introduction to the theory of numbers pdf](https://blngcc.files.wordpress.com/2008/11/hardy-wright-theory_of_numbers.pdf)
, книга со всеми доказательствами.
* [Шаблоны алгоритмики](https://github.com/algorithmica-org/algorithmica), то, откуда были взяты css-файлы и шрифты для отображения этой
статьи