Solve task
This commit is contained in:
@@ -39,12 +39,20 @@
|
||||
- *Выходные данные:* таблица со столбцами (название архива, название файла, размер в Мб)
|
||||
- *Решение:* смотри файл archive_table.py
|
||||
|
||||
## Задачи
|
||||
|
||||
### Сопоставление игр с жанрами
|
||||
|
||||
Необходимо для каждой игры из базового набора найти жанры на ее странице на metacritic. Создать таблицу жанров и соединить отношением многие-ко-многим с таблицей базового набора игр.
|
||||
|
||||
- *Входные данные:* html-страницы, по одной на игру из базового набора
|
||||
- *Выходные данные:* таблица жанров, таблица связей со столбцами (игра, жанр)
|
||||
- *Решение:* смотри файл scrape_genres.py
|
||||
|
||||
## Задачи
|
||||
|
||||
### Проверить базовый набор
|
||||
|
||||
Необходимо просмотреть жанры, маловстречающиеся и повторяющиеся объединить, построить примерное дерево категорий.
|
||||
|
||||
### Сопоставление базового с полным набором игр
|
||||
|
||||
Необходимо реализовать быстрый неточный поиск из базового набора в полном. Предложение: построить однословные индексы по базовому и полному набору, при сопоставлении использовать расстояние Левенштейна около 3.
|
||||
|
||||
Reference in New Issue
Block a user