Question:
Comment gérer les publications sur un ordinateur local
user32882
2019-11-08 14:24:53 UTC
view on stackexchange narkive permalink

Je voudrais trouver une meilleure façon de nommer les publications que je stocke sur mon ordinateur local sous forme de fichiers PDF. Jusqu'à présent, j'ai fait quelque chose comme ceci:

Albano R., Sole A., Adamowski J., Mancusi L. (2014) - Un modèle basé sur un SIG pour estimer les conséquences des inondations et les degré d'accessibilité et d'opérabilité des structures stratégiques d'intervention d'urgence dans les zones urbaines.pdf

Ceci présente quelques inconvénients:

  • Les titres peuvent être extrêmement longs. Cela pose des problèmes dans certains systèmes d'exploitation ou logiciels tels que OneDrive. Vous ne pouvez avoir qu'un nombre limité de caractères dans un nom de fichier ...
  • Toutes les publications ne peuvent pas suivre ce format. Ce qui précède est acceptable pour les articles de journaux et les thèses, mais pas tant pour les livres ou autres types de publications.

Je voudrais avoir une manière cohérente de gérer une telle base de données. J'ai pensé à conserver les métadonnées de publication telles que les auteurs, la date de publication, le type de publication et le type dans un fichier texte ou Excel séparé et à nommer les fichiers PDF par ID, comme 1.pdf , 2.pdf , etc. Cela pourrait fonctionner, mais il faudrait se référer à et gérer une feuille de calcul qui contiendrait toutes les métadonnées.

Y a-t-il une méthode simple ou peut-être un logiciel léger que je pouvez-vous utiliser ce qui peut m'aider dans ce genre de tâche?

MODIFIER

Je n'ai pas vraiment aimé la façon dont le script de @Jonas Stein est configuré, même si je lui dois l'inspiration et l'indication d'utiliser JabRef. Voici mon script alternatif:

  import bibtexparserimport osfrom shutil import copyfilefilename = 'db.bib'out_folder =' out 'with open (filename) as bibtex_file: db = bibtexparser.load (bibtex_file) pour l'entrée dans db.entries: print (entrée ['fichier']) id = entrée ['ID'] fichier = entrée ['fichier']. split (':') [1] copyfile (fichier, os.path.join ( out_folder, id) + '. pdf') print ('done')  

C'est beaucoup plus compact et fait le travail.

Certaines personnes ont suggéré d'utiliser un logiciel dédié pour cette question.Absolument recommandable.Une autre possibilité est [Zotero] (https://www.zotero.org).Il peut importer automatiquement tous vos PDF permettant une bonne organisation de votre bibliothèque, une recherche plein texte, la production de bibliographie, etc. Fonctionne avec LaTeX, Word, ...
Écrivez-vous en LaTeX?Si tel est le cas, un fichier bibtex se chargera déjà de stocker toutes les métadonnées.Ensuite, je suggère des noms de fichiers correspondant aux clés de citation bibtex, et je suis la convention "turing1936computable", "shannon1948mathematical", etc. (Nom du premier auteur uniquement.)
Pour moi, il est généralement important de savoir si l'article est à auteur unique, à deux auteurs ou à plusieurs auteurs.Par conséquent, je choisis le format recommandé par jabref `author1999` /` authorA.authorB1999` / `authorA.etal1999`.Rien de plus.Le reste des détails peut être facilement trouvé via votre gestionnaire de bibliographie (j'utilise jabref sur les fichiers bibtex).
Si vous utilisez WIndows, pourquoi ne pas utiliser le balisage (et les détails, etc.) déjà disponibles dans la structure des dossiers de fichiers?Voir par exemple, «Comment étiqueter des fichiers pour ranger vos fichiers Windows 10» https://www.laptopmag.com/articles/tagging-files-windows-10.De cette façon, les informations sont là dans le bon vieil explorateur de fichiers et n'ont pas besoin d'ouvrir un nouveau logiciel.
Ce que @TasosPapastylianou [dit] (https://academia.stackexchange.com/questions/139733/how-to-manage-publications-on-a-local-computer#comment371310_139733).Ce qui est cool avec JabRef, c'est qu'il génère automatiquement des clés si vous appuyez sur CRTL-G, sans ambiguïté si nécessaire ("Foo2019" contre "Foo2019a").Si vous nommez simplement les fichiers avec les clés, JabRef s'y lie automatiquement et vous pouvez ouvrir le PDF (ou un autre type de fichier) en un seul clic à partir de l'entrée JabRef.Très bien.
Neuf réponses:
#1
+33
gerrit
2019-11-08 17:11:26 UTC
view on stackexchange narkive permalink

Pour le nom de fichier, j'utilise un système que j'ai plagié de mon directeur de thèse:

aaaadd_xxxx_jjj.pdf

où:

  • aaaa: nom du premier auteur (longueur variable)
  • jj: année de publication à 2 chiffres (longueur fixe)
  • xxxx: premier mot du titre, moins articles et autres petits mots (longueur variable)
  • jjj: abréviation de journal de publication (longueur variable, mais courte)

J'utilise alors le même sans le .pdf comme ma clé bibtex (avec un :) ajouté.

Par exemple:

T. Penguin et al, a Survey of Antarctic Leasure Activities, Journal of Improbable Results, 2025

serait

penguin25_survey_jir.pdf

avec la clé bibtex penguin25:_survey_jir.

J'aime ce système parce que:

  • J'y suis habitué
  • Les noms de fichiers restent compacts et compatibles avec le shell UNIX
  • Les informations encodées me suffisent généralement pour identifier l'article

Cela ne couvre pas le balisage ou la catégorisation.

Ceci s'applique bien aux articles de revues. Pour les articles ou les livres d'actes de conférence, l'acronyme de la revue est remplacé par un acronyme de la conférence ou de l'éditeur, ou peut-être le nom complet de l'éditeur; Je ne suis pas tout à fait cohérent là-bas. Mais je n'ai généralement pas de livres entiers au format PDF.

Quels sont les avantages et les inconvénients de ce format?
@FedericoPoloni Ajout de quelques puces abordant cette question.
Avez-vous un mini bogue de l'an 2000 dans votre format ou est-ce que cela n'a pas d'importance?
Un problème avec ce format est que vous ne voyez que le nom de famille du premier auteur, et parfois c'est le nom du dernier auteur qui compte beaucoup pour vous.
@AaronF Jusqu'à ce que je reçoive des articles publiés par des auteurs du même nom, du même titre et du même journal, exactement 100 ans entre les deux, peu importe.Je n'ai pas beaucoup de papiers vieux de plus de 100 ans.
@DmitrySavostyanov Dans [certains domaines] (https://academia.meta.stackexchange.com/a/4473/1033), le dernier auteur a une signification importante.Ce n'est pas le cas dans mon domaine.Bien sûr, beaucoup d'informations sont inévitablement perdues, condensant la liste des auteurs et le titre sous une forme aussi courte que je l'ai décrite.
"J'aime ce système parce que j'y suis habitué".Eh bien, ça doit être un argument pour n'importe quel système
@infinitezero Vous pouvez être habitué à quelque chose et ne pas l'aimer ... comme vous lever avant 8 heures du matin
#2
+17
FChm
2019-11-08 15:16:56 UTC
view on stackexchange narkive permalink

Il existe de nombreux logiciels qui peuvent vous aider (par exemple, Mendeley). J'ai utilisé ceci (et d'autres) mais j'ai trouvé que cela prendrait plus de gestion que je ne voudrais en donner.

Personnellement, je viens d'avoir un dossier de publications avec des sous-dossiers imbriqués pour différents sujets. Je nommerais alors simplement le .pdfs en utilisant le nom du premier auteur et l'année de publication, c'est-à-dire: lastname_2019.

J'ai trouvé que cela avait plusieurs avantages:

  1. C'est facile à retenir. Lors d'une discussion avec des pairs, je pourrais facilement les renvoyer à un article par nom en 2019 . C'est formidable de pouvoir le faire facilement et cela contribue à votre réputation. L'alternative consiste à discuter avec des pairs qui se souviennent vaguement du contenu d'un article, mais ne se souviennent pas du titre ou de la paternité.
  2. Il est facile de rechercher l'article en utilisant (par exemple) Spotlight dans macOS. Je viens de taper le nom de famille et tous leurs papiers reviennent. Aide également à mémoriser le nom de famille des auteurs. Je me suis beaucoup appuyé sur cela et je n'ai jamais vraiment cherché dans le dossier des publications.
  3. Si j'utilisais LaTeX, je pouvais facilement me souvenir des articles que je voulais citer et comme je définissais la référence du dossard sur nom_2019 format, je n'avais plus d'informations à retenir.

Bien sûr, si une personne publie plusieurs articles en un an, j'ajouterais simplement une lettre à l'ajout. Pour être honnête, je pense que je n'ai eu à le faire qu'une ou deux fois pour mon domaine.

Pour moi, cela n'a jamais fonctionné, pour plusieurs raisons: 1) beaucoup d'articles peuvent appartenir à différents projets / sous-dossiers. 2) de nombreux cas, le premier auteur n'est pas le «plus important», après qui le nommez-vous?3) dans mon domaine, il est assez courant d'avoir plus d'un article par an
Alors Mendeley est votre ami car vous pouvez attribuer des publications à différents dossiers.Dans mon domaine, le premier auteur est toujours le plus important, et si ce n'était pas le cas, je ne pense pas que ce soit important pour le référencement, en aucun cas il n'attribue de crédit.
Je pense que cela fonctionne bien dans certains domaines comme les mathématiques.J'ai fait quelque chose de très similaire là-bas.Vraisemblablement, cela ne fonctionne pas très bien dans d'autres domaines, où la plupart des articles ont beaucoup d'auteurs et le nombre moyen d'articles par an et le chercheur est beaucoup plus grand qu'un.
Je ne veux pas nécessairement dire attribuer des crédits, mais lorsque vous avez un professeur établi avec plus de 20 collaborateurs, écrivant 20 articles par an, alors vous, en tant que chercheur externe, utiliseriez probablement le nom du chef de groupe pour référencer, puisque c'est ce que vous feriezrappelles toi.\
Mendeley n'est pas mauvais, mais tellement propriétaire (
#3
+11
Jonas Stein
2019-11-09 20:10:22 UTC
view on stackexchange narkive permalink

Je gère des publications avec JabRef dans une base de données bibtex. Il est possible d'ajouter un lien vers le nom de fichier avec JabRef dans la base de données bibtex.

Un script python pybibtexcleaner transcrit les caractères spéciaux dans le titre et déplace tous les fichiers triés vers un dossier avec des noms de fichiers au format

  bibkey-title.pdf  

Le script sera généré à partir d'une entrée de dossard

  @Article {Stein2017a, author = {J. Stein et M. Baum et S. Holbein et T. Finger et T. Cronert et C. Tölzer et T. Fröhlich et S. Biesenkamp et K. Schmalzl et P. Steffens et C.H. Lee et M. Braden}, title = {Control of Chiral Magnetism Through Electric Fields in Multiferroic Compounds above the Long-Range Multiferroic Transition}, journal = {Physical Review Letters}, year = {2017}, volume = {119}, number = {17}, doi = {10.1103 / physrevlett.119.177201}, file = {: ../ inclus / 119.177201.pdf}, publisher = {American Physical Society ({APS})}}  

le nouveau nom de fichier

  Multiferroic_Transition.pdf`  

et copiez le fichier dans

et copiez le fichier dans

et copiez le fichier dans

code> et ajustez également le chemin dans le fichier .bib .

C'est très utile si les noms de fichiers commencent par la bibkey . Vous devez toujours utiliser tous les chiffres de l'année .

Le script peut également transcrire des formules chimiques de manière lisible, si elles sont introduites avec \ ce comme dans \ce{H2O}.

Vous pouvez suivre votre travail avec git et vous pouvez restaurer l'ancien versions ou synchronisez la base de données documentaire sur vos différents systèmes.

ps: J'utilise l'ancienne version stable 3.8.2 de JabRef, car les nouvelles versions 4.x étaient moins stables quand je les ai essayées. L'utilisateur a un meilleur contrôle sur le processus de changement de nom avec le court script python et peut facilement l'ajuster aux besoins, mais les versions récentes de JabRef sont livrées avec des fonctionnalités similaires.

Jabref est génial.Une fois que vous avez votre bibliothèque, vous pouvez la rechercher et la gérer.J'ai ajouté un champ supplémentaire pour mes propres notes sur les papiers que j'ai lus.
Oui, @Ivana.Vous pouvez également utiliser un «groupe» pour les articles «imprimés» ou «lus».
J'aime ta suggestion.J'ai téléchargé JabRef et essayé de télécharger votre script depuis github.J'ai créé une base de données JabRef à 1 document, modifié le fichier `pybibtexcleaner.ini` selon ma propre configuration et essayé` python pybibtexcleaner.py`.Cependant `re` a jeté une erreur:` re.error: bad escape \ m à la position 1. La ligne problématique est la ligne 29. Selon vous, quel pourrait être le problème?Merci.
@user32882 oh oui il y avait un bug.Veuillez extraire la dernière version et réessayer
Cela semble fonctionner maintenant mais je ne comprends pas vraiment le but de ce script.Vous analysez le fichier .bib, extrayez les titres puis réécrivez le fichier dans un autre dossier sous le nom `bibkey-title.pdf`.Quel est le but de ça?Aussi pourquoi ajouter le titre?Certains titres peuvent être super longs ...
@user32882 le but est d'avoir des fichiers avec des noms de fichiers uniques qui peuvent être utilisés par un humain pour voir directement quel pdf est lié à un `\ ref {}`.Vous pouvez limiter la longueur du nom de fichier simplement en coupant la chaîne après n caractères.
Je pense que votre scénario est trop compliqué.S'il vous plaît voir ma modification pour quelque chose de super simple qui fonctionne et est facile à déboguer
#4
+7
Ian Sudbery
2019-11-08 16:04:28 UTC
view on stackexchange narkive permalink

J'utilise mendeley avec l'analyse automatique des dossiers. Je télécharge un article avec un nom de fichier comme SI90234023499-II.pdf le vide dans l'un de mes dossiers surveillés, et il est automatiquement trié dans ~ / Literature / FirstAuthor / Year / Journal / Title. pdf et ajouté à la base de données Mendeley. Vous pouvez personnaliser l'emplacement du répertoire à partir de n'importe quelle combinaison de métadonnées, mais pour moi, cela n'a pas vraiment d'importance car j'accède de toute façon uniquement à des éléments via l'application Mendeley, donc je gère rarement les fichiers PDF directement.

Notez que Mendeley est une base de données propriétaire.Les utilisateurs de ces systèmes basés sur le cloud investissent leur temps pour créer une base de données qu'ils ne possèdent pas.Ces systèmes sont conçus pour un verrouillage fort des fournisseurs. Je suggère d'utiliser des solutions gratuites et open source, où la communauté garde le contrôle sur ses propres données et peut corriger les bogues.
Si un tel système existait, je l'utiliserais, mais je n'ai pas encore trouvé de système qui fonctionne pour prendre automatiquement mes documents sans intervention manuelle, supprimer les informations de manière fiable, renommer et classer automatiquement le PDF et le rendre automatiquement disponible surtous mes appareils (2x bureau, 1x ordinateur portable, 1x téléphone Android, 1x iPad iOS) et s'intégreront à MS word.
@IanSudbery Zotero, combiné avec le plugin Zotfile, fera tout cela sauf pour les appareils mobiles, et pour cette interface avec Dropbox etc. Et c'est open source, donc vous savez que vos données ne seront jamais verrouillées avec Elsevier.Pas trop de problème si vous ne l'utilisez que pour conserver des données d'annotation, mais une très grosse affaire si vous prenez des notes dans le système.
#5
+6
kjetil b halvorsen
2019-11-08 18:19:58 UTC
view on stackexchange narkive permalink

Pour les livres, vous pouvez utiliser Calibre, un programme gratuit de gestion de livres électroniques. Facile à utiliser.

D'accord.Calibre pour la gestion des fichiers et Zotero pour les références.
#6
+2
Flydog57
2019-11-09 02:19:49 UTC
view on stackexchange narkive permalink

Que diriez-vous d'Excel.

  • Commencez par nommer vos documents PDF en utilisant un schéma de dénomination comme ce que @gerrit a suggéré (ou un autre mécanisme qui aboutit à des noms de fichiers gérables / reconnaissables).
  • Créez un Document de feuille de calcul Excel. Rendre la colonne A très large. Chaque ligne représentera un seul fichier
  • Sélectionnez une cellule. Choisissez l'onglet Insertion et appuyez sur Lien
  • Collez le nom complet du document (dans le format que vous souhaitez) dans le "Texte à afficher" champ
  • Accédez à votre fichier PDF dans le navigateur de fichiers, sélectionnez le bon fichier et cliquez sur OK

Vous disposez désormais d'un document de recherche contenant les titres de vos publications et des liens cliquables à vos documents

Si vous voulez être sophistiqué, vous pouvez avoir plusieurs colonnes (date de publication, auteurs (ou peut-être auteur principal et autres auteurs), titre, etc.). Mettez des en-têtes de colonnes. Désormais, il n'est pas seulement consultable, mais il est triable et filtrable (en particulier si vous le créez sous forme de tableau (jouez avec le bouton Table sur le onglet Insérer .))

Chaque startup doit considérer: votre produit peut-il remplacer Excel?
#7
+1
stackzebra
2019-11-10 18:23:37 UTC
view on stackexchange narkive permalink

Je vous recommande de nommer les articles comme vous dites 1.pdf, 2.pdf, et d'avoir les fichiers de métadonnées correspondants 1.txt, 2.txt que vous pouvez structurer comme vous le souhaitez.

Ensuite, la partie cruciale est la suivante: utilisez grep (disponible pour Linux et Windows) pour rechercher dans le contenu de tous les fichiers texte de ce dossier. Cela vous permettra de trouver quels fichiers txt contiennent les termes recherchés.

La recherche est aussi simple que cela (cela montrera quels fichiers texte dans le dossier actuel contiennent le mot "Adamowski"):

  grep -r "Adamowski".  

Je pense que c'est le moyen le plus simple.

pdfgrep pourrait être utile pour cette solution: https://pdfgrep.org/
#8
  0
homocomputeris
2019-11-09 19:14:39 UTC
view on stackexchange narkive permalink

Y a-t-il une méthode simple ou peut-être un logiciel léger que je peux utiliser qui peut m'aider dans ce genre de tâche?

Bien que ce soit un peu exagéré, JabRef peut conserver la bibliographie et renommer les fichiers:

Le changement de nom des fichiers fait désormais partie de la fonction "Nettoyer les entrées" (bouton pinceau dans la barre d'outils ou Ctrl + Maj + F7) . Ensuite, vous pouvez renommer les fichiers joints en fonction de la clé BibTeX. Vous pouvez changer le format (modèle) sous Options → Préférences → Importer, en modifiant le modèle sous «Action de lien de fichier PDF par défaut».

Et les modèles sont divers, et il est possible d'abréger systématiquement les noms de journaux, les titres et de combiner les noms d'auteurs, par exemple:

Modèles de clés liés à l'auteur

  • [auth]: Le nom du premier auteur
  • [auteurs]: Le nom de tous les auteurs
  • [authorLast]: Le nom du dernier auteur

Modèles de touches liés au titre

  • [shorttitle]: les 3 premiers mots du titre, sans tenir compte des mots de fonction ( voir ci-dessous). Par exemple, Un papier génial sur JabRef devientAwesomePaperJabref.
  • [veryshorttitle]: Le premier mot du titre, ignorant les mots de fonction (voir ci-dessous). Par exemple, Un papier génial sur JabRef devient Génial.
  • [camel]: Mettre en majuscule et concaténer tous les mots du titre. Par exemple, un article génial sur JabRef devient AnAwesomePaperOnJabref.
  • [title]: Mettre en majuscule tous les mots significatifs du titre et les concaténer. Par exemple, An awesome paper sur JabRef devient AnAwesomePaperonJabref.

Modificateurs En général, les modificateurs sont appliqués dans l'ordre dans lequel ils sont spécifiés. Dans ce qui suit, nous présentons une liste des modificateurs les plus courants avec une brève explication:

  • : abbr: Abrège le texte produit par le nom de champ ou spécial marqueur de champ. Seuls le premier caractère et les caractères suivants après l'espace blanc seront inclus. Par exemple:
    • [journal: abbr] du nom de la revue "Journal of Fish Biology" produirait "JoFB".
    • [title: abbr] aurait du titre "Un article génial sur JabRef »produirait« AAPoJ ».
    • [camel: abbr], du titre« Un papier génial sur JabRef », produirait« AAPOJ ».
#9
-1
Erel Segal-Halevi
2019-11-10 16:07:30 UTC
view on stackexchange narkive permalink

Ma méthode consiste à nommer chaque fichier PDF comme suit:

  année, auteurs, titre.pdf  

Par exemple:

  2020, Abc Def Ghi, Les lettres de l'alphabet.pdf  

Je travaille avec Ubuntu et je n'ai jamais eu de problèmes avec ces noms de fichiers, bien qu'ils contiennent des espaces et des virgules.

Mettre l'année en premier facilite le tri des articles par année dans l'explorateur de fichiers.

Mettre le titre dans le nom du fichier permet de voir immédiatement dans l'explorateur de fichiers ce qu'est le fichier à propos.

Vous avez de la chance, si vous n'avez eu aucun problème avec les espaces et les virgules dans les noms de fichiers.Cela appelle des ennuis.Comment transcrire les noms des auteurs avec des caractères non latins?
Comment limitez-vous la longueur du titre?La plupart des systèmes de fichiers et des programmes ont une longueur de nom de fichier très limitée.
@JonasStein, il n'est pas nécessaire de mettre les noms exacts (avec des caractères non latins) ou le titre complet - il suffit de mettre une quantité suffisante du titre pour que vous compreniez ce qu'il y a à l'intérieur.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 4.0 sous laquelle il est distribué.
Loading...