Solve task

This commit is contained in:
2021-10-13 22:03:12 +03:00
parent ed1eed7d0a
commit 79afe02da4
5 changed files with 165 additions and 12 deletions
+10 -2
View File
@@ -39,12 +39,20 @@
- *Выходные данные:* таблица со столбцами (название архива, название файла, размер в Мб)
- *Решение:* смотри файл archive_table.py
## Задачи
### Сопоставление игр с жанрами
Необходимо для каждой игры из базового набора найти жанры на ее странице на metacritic. Создать таблицу жанров и соединить отношением многие-ко-многим с таблицей базового набора игр.
- *Входные данные:* html-страницы, по одной на игру из базового набора
- *Выходные данные:* таблица жанров, таблица связей со столбцами (игра, жанр)
- *Решение:* смотри файл scrape_genres.py
## Задачи
### Проверить базовый набор
Необходимо просмотреть жанры, маловстречающиеся и повторяющиеся объединить, построить примерное дерево категорий.
### Сопоставление базового с полным набором игр
Необходимо реализовать быстрый неточный поиск из базового набора в полном. Предложение: построить однословные индексы по базовому и полному набору, при сопоставлении использовать расстояние Левенштейна около 3.