moviewyrm/bookwyrm/goodreads_import.py

''' handle reading a csv from goodreads '''
import csv
import logging

from bookwyrm import models
from bookwyrm.models import ImportJob, ImportItem
from bookwyrm.status import create_notification
from bookwyrm.tasks import app

logger = logging.getLogger(__name__)


def create_job(user, csv_file, include_reviews, privacy):
    ''' check over a csv and creates a database entry for the job'''
    job = ImportJob.objects.create(
        user=user,
        include_reviews=include_reviews,
        privacy=privacy
    )
    for index, entry in enumerate(list(csv.DictReader(csv_file))):
        if not all(x in entry for x in ('ISBN13', 'Title', 'Author')):
            raise ValueError('Author, title, and isbn must be in data.')
        ImportItem(job=job, index=index, data=entry).save()
    return job


def create_retry_job(user, original_job, items):
    ''' retry items that didn't import '''
    job = ImportJob.objects.create(
        user=user,
        include_reviews=original_job.include_reviews,
        privacy=original_job.privacy,
        retry=True
    )
    for item in items:
        ImportItem(job=job, index=item.index, data=item.data).save()
    return job


def start_import(job):
    ''' initalizes a csv import job '''
    result = import_data.delay(job.id)
    job.task_id = result.id
    job.save()


@app.task
def import_data(job_id):
    ''' does the actual lookup work in a celery task '''
    job = ImportJob.objects.get(id=job_id)
    try:
        for item in job.items.all():
            try:
                item.resolve()
            except Exception as e:# pylint: disable=broad-except
                logger.exception(e)
                item.fail_reason = 'Error loading book'
                item.save()
                continue

            if item.book:
                item.save()

                # shelves book and handles reviews
                handle_imported_book(
                    job.user, item, job.include_reviews, job.privacy)
            else:
                item.fail_reason = 'Could not find a match for book'
                item.save()
    finally:
        create_notification(job.user, 'IMPORT', related_import=job)
        job.complete = True
        job.save()


def handle_imported_book(user, item, include_reviews, privacy):
    ''' process a goodreads csv and then post about it '''
    if isinstance(item.book, models.Work):
        item.book = item.book.default_edition
    if not item.book:
        return

    existing_shelf = models.ShelfBook.objects.filter(
        book=item.book, user=user).exists()

    # shelve the book if it hasn't been shelved already
    if item.shelf and not existing_shelf:
        desired_shelf = models.Shelf.objects.get(
            identifier=item.shelf,
            user=user
        )
        models.ShelfBook.objects.create(
            book=item.book, shelf=desired_shelf, user=user)

    for read in item.reads:
        # check for an existing readthrough with the same dates
        if models.ReadThrough.objects.filter(
                user=user, book=item.book,
                start_date=read.start_date,
                finish_date=read.finish_date
            ).exists():
            continue
        read.book = item.book
        read.user = user
        read.save()

    if include_reviews and (item.rating or item.review):
        review_title = 'Review of {!r} on Goodreads'.format(
            item.book.title,
        ) if item.review else ''

        # we don't know the publication date of the review,
        # but "now" is a bad guess
        published_date_guess = item.date_read or item.date_added
        models.Review.objects.create(
            user=user,
            book=item.book,
            name=review_title,
            content=item.review,
            rating=item.rating,
            published_date=published_date_guess,
            privacy=privacy,
        )
code style cleanup 2020-03-29 07:05:09 +00:00			`''' handle reading a csv from goodreads '''`
Handle uploaded CSV and match to openlibrary titles. 2020-03-25 12:29:21 +00:00			`import csv`
fixes import matching with local books 2020-11-13 17:47:35 +00:00			`import logging`
Handle uploaded CSV and match to openlibrary titles. 2020-03-25 12:29:21 +00:00
Removes outgoing and view_actions 2021-01-13 21:36:01 +00:00			`from bookwyrm import models`
Updates migrations To get the app working again I ran resetdb, let it crash in initdb, then ran the migration, then re-ran initdb 2020-09-21 15:10:37 +00:00			`from bookwyrm.models import ImportJob, ImportItem`
			`from bookwyrm.status import create_notification`
Removes outgoing and view_actions 2021-01-13 21:36:01 +00:00			`from bookwyrm.tasks import app`
code style cleanup 2020-03-29 07:05:09 +00:00
fixes import matching with local books 2020-11-13 17:47:35 +00:00			`logger = logging.getLogger(__name__)`
Shelve the books. 2020-03-25 12:58:27 +00:00
code style cleanup 2020-03-29 07:05:09 +00:00
Allow users to set privacy on imported reviews or not import them at all. Fixes #252 2020-10-30 18:21:02 +00:00			`def create_job(user, csv_file, include_reviews, privacy):`
code style cleanup 2020-05-09 21:26:27 +00:00			`''' check over a csv and creates a database entry for the job'''`
Allow users to set privacy on imported reviews or not import them at all. Fixes #252 2020-10-30 18:21:02 +00:00			`job = ImportJob.objects.create(`
			`user=user,`
			`include_reviews=include_reviews,`
			`privacy=privacy`
			`)`
Removes import limit 2021-01-02 17:42:33 +00:00			`for index, entry in enumerate(list(csv.DictReader(csv_file))):`
Do some checks to make sure we've got a csv file on import. Fixes #104. 2020-04-29 14:33:06 +00:00			`if not all(x in entry for x in ('ISBN13', 'Title', 'Author')):`
Move past all book loading exceptions during import 2020-11-12 21:33:12 +00:00			`raise ValueError('Author, title, and isbn must be in data.')`
Store csv in the database and then import via celery. 2020-04-21 14:09:21 +00:00			`ImportItem(job=job, index=index, data=entry).save()`
			`return job`
Handle uploaded CSV and match to openlibrary titles. 2020-03-25 12:29:21 +00:00
Tests for goodreads import lookup 2021-01-02 19:29:50 +00:00
Allow import retry 2020-11-13 17:02:41 +00:00			`def create_retry_job(user, original_job, items):`
			`''' retry items that didn't import '''`
			`job = ImportJob.objects.create(`
			`user=user,`
			`include_reviews=original_job.include_reviews,`
			`privacy=original_job.privacy,`
			`retry=True`
			`)`
			`for item in items:`
			`ImportItem(job=job, index=item.index, data=item.data).save()`
			`return job`
code style cleanup 2020-05-09 21:26:27 +00:00
Tests for goodreads import lookup 2021-01-02 19:29:50 +00:00
Store csv in the database and then import via celery. 2020-04-21 14:09:21 +00:00			`def start_import(job):`
code style cleanup 2020-05-09 21:26:27 +00:00			`''' initalizes a csv import job '''`
Store csv in the database and then import via celery. 2020-04-21 14:09:21 +00:00			`result = import_data.delay(job.id)`
			`job.task_id = result.id`
			`job.save()`
First draft async imports. 2020-04-20 16:10:19 +00:00
code style cleanup 2020-05-09 21:26:27 +00:00
First draft async imports. 2020-04-20 16:10:19 +00:00			`@app.task`
Store csv in the database and then import via celery. 2020-04-21 14:09:21 +00:00			`def import_data(job_id):`
code style cleanup 2020-05-09 21:26:27 +00:00			`''' does the actual lookup work in a celery task '''`
Store csv in the database and then import via celery. 2020-04-21 14:09:21 +00:00			`job = ImportJob.objects.get(id=job_id)`
Fixing up notifications. 2020-04-22 11:43:10 +00:00			`try:`
			`for item in job.items.all():`
			`try:`
			`item.resolve()`
disable some warnings 2020-12-13 02:13:00 +00:00			`except Exception as e:# pylint: disable=broad-except`
fixes import matching with local books 2020-11-13 17:47:35 +00:00			`logger.exception(e)`
Move past all book loading exceptions during import 2020-11-12 21:33:12 +00:00			`item.fail_reason = 'Error loading book'`
			`item.save()`
Small fix in goodreads import error handling 2020-11-12 22:01:17 +00:00			`continue`

Fixing up notifications. 2020-04-22 11:43:10 +00:00			`if item.book:`
			`item.save()`
Allow users to set privacy on imported reviews or not import them at all. Fixes #252 2020-10-30 18:21:02 +00:00
Still shelve books in no-reviews import mode 2020-10-30 19:07:22 +00:00			`# shelves book and handles reviews`
Removes outgoing and view_actions 2021-01-13 21:36:01 +00:00			`handle_imported_book(`
Still shelve books in no-reviews import mode 2020-10-30 19:07:22 +00:00			`job.user, item, job.include_reviews, job.privacy)`
Fixing up notifications. 2020-04-22 11:43:10 +00:00			`else:`
Move past all book loading exceptions during import 2020-11-12 21:33:12 +00:00			`item.fail_reason = 'Could not find a match for book'`
Fixing up notifications. 2020-04-22 11:43:10 +00:00			`item.save()`
			`finally:`
			`create_notification(job.user, 'IMPORT', related_import=job)`
Adds field on import job to check if job completed the task isn't a reliable indicator, unfortunately. 2021-01-07 16:08:12 +00:00			`job.complete = True`
			`job.save()`
Removes outgoing and view_actions 2021-01-13 21:36:01 +00:00

			`def handle_imported_book(user, item, include_reviews, privacy):`
			`''' process a goodreads csv and then post about it '''`
			`if isinstance(item.book, models.Work):`
			`item.book = item.book.default_edition`
			`if not item.book:`
			`return`

			`existing_shelf = models.ShelfBook.objects.filter(`
circular import issues and added_by migration 2021-02-04 22:27:26 +00:00			`book=item.book, user=user).exists()`
Removes outgoing and view_actions 2021-01-13 21:36:01 +00:00
			`# shelve the book if it hasn't been shelved already`
			`if item.shelf and not existing_shelf:`
			`desired_shelf = models.Shelf.objects.get(`
			`identifier=item.shelf,`
			`user=user`
			`)`
Remove explicit broadcast calls 2021-02-04 21:21:55 +00:00			`models.ShelfBook.objects.create(`
circular import issues and added_by migration 2021-02-04 22:27:26 +00:00			`book=item.book, shelf=desired_shelf, user=user)`
Removes outgoing and view_actions 2021-01-13 21:36:01 +00:00
			`for read in item.reads:`
			`# check for an existing readthrough with the same dates`
			`if models.ReadThrough.objects.filter(`
			`user=user, book=item.book,`
			`start_date=read.start_date,`
			`finish_date=read.finish_date`
			`).exists():`
			`continue`
			`read.book = item.book`
			`read.user = user`
			`read.save()`

			`if include_reviews and (item.rating or item.review):`
			`review_title = 'Review of {!r} on Goodreads'.format(`
			`item.book.title,`
			`) if item.review else ''`

			`# we don't know the publication date of the review,`
			`# but "now" is a bad guess`
			`published_date_guess = item.date_read or item.date_added`
Remove explicit broadcast calls 2021-02-04 21:21:55 +00:00			`models.Review.objects.create(`
Removes outgoing and view_actions 2021-01-13 21:36:01 +00:00			`user=user,`
			`book=item.book,`
			`name=review_title,`
			`content=item.review,`
			`rating=item.rating,`
			`published_date=published_date_guess,`
			`privacy=privacy,`
			`)`