Question:
Est-il conseillé de mettre toute la source de ma thèse sur GitHub?
Approximist
2012-02-25 07:04:33 UTC
view on stackexchange narkive permalink

J'utilise git depuis un moment et maintenant GitHub. Je commence à rédiger un mémoire de maîtrise. Serait-ce une bonne idée de télécharger tous les fichiers dans des référentiels publics en ligne? Quelqu'un a-t-il une expérience avec ça?

EDIT: Merci pour toutes les réponses. J'ai consulté mon conseiller à ce sujet, et il a dit que les sources de latex étaient correctes, car le document sera de toute façon en libre accès. Cependant, mon code source ne l'était pas, principalement parce que la collaboration a déjà un wiki protégé pour de telles choses.

[Github propose des dépôts privés pour les utilisateurs universitaires] (https://github.com/edu). Voir aussi [cette question Tex SE] (http://tex.stackexchange.com/q/31103/272) pour de nombreux conseils sur l'utilisation de LaTeX pour rédiger une thèse.
@eykanal, merci pour le lien mais malheureusement github n'offre pas actuellement de référentiels privés gratuits pour les utilisateurs académiques ... ils disent qu'ils en offriront plus "bientôt". https://bitbucket.org/ propose des référentiels privés gratuits pour tous
Maintenant, github en a un, j'en ai un et j'en suis très content. :)
@crash ils ont des remises «éducatives», mais celles-ci ne sont pas disponibles pour un usage académique en général - sauf si je manque quelque chose https://github.com/edu.
Des dépôts privés gratuits et illimités sont désormais disponibles pour tous.
Sept réponses:
Fomite
2012-02-25 10:39:10 UTC
view on stackexchange narkive permalink

On m'a dit pour votre domaine que la réponse pourrait être oui, car vous êtes légèrement moins menacé en termes de ramassage que la plupart des autres, la physique dépendant (apparemment) en grande partie de qui soumet en premier.

Je serait extrêmement prudent de publier la source de ma thèse dans son intégralité sur un référentiel public. Je suis tout à fait pour la science reproductible et le libre accès, mais le public ne devrait avoir accès à votre code que lorsque cette condition est remplie:

Vous n'avez plus accès à l'accès exclusif à votre code. Toutes les questions que vous avez programmées ont reçu une réponse, les articles et les présentations qui en découlent sont sous presse, et à ce stade, il s'agit de recherches reproductibles.

Une fois que c'est vrai , sûr. Jusqu'à ce point? Vous courez le risque que vos recherches soient volées.

Vous pouvez également le faire lorsque vos recherches sont si étonnantes qu'elles ouvrent de nouveaux domaines que vous ne pourriez pas explorer en une seule vie.
Attends quoi? Est-ce que publier votre travail sur github ne lui donne pas un horodatage? (Bien que je suppose que si vous êtes vraiment inquiet, vous pouvez le publier sur l'ArXiv en même temps.)
@JeffE Cela vous donne un horodatage - mais cela ne signifie pas nécessairement que certains champs considéreront cet horodatage comme "premier entré". Il n'est pas vraiment difficile de modifier suffisamment le code de quelqu'un, ou d'obscurcir en ne publiant pas votre propre code, pour que le risque de scoop / plagiat soit réel. Au-delà du risque / si vous sortiriez ou non de l'avant, dans mon esprit, ne jamais avoir à faire face à un scandale de vol de propriété intellectuelle (même en tant que partie lésée) en tant qu'étudiant diplômé dépasse l'utilité marginale de l'ouverture de vos affaires.
@DavidKetcheson J'avais envisagé d'ajouter quelque chose comme ça, mais j'avais du mal à trouver quelque chose d'assez poétique comme description.
@EpiGrad: Je ne peux tout simplement pas imaginer quiconque s'en tirerait avec ce genre de vol face à des preuves facilement disponibles. J'ai toujours pensé aux horodatages publics et facilement vérifiables comme une * défense * contre le scooping. J'ai vu (quelques) articles rejetés parce que les auteurs n'ont pas cité une pré-impression ArXiv indépendante d'un mois avec des résultats similaires. J'ai aussi vu des auteurs sélectionnés parce qu'ils * n'avaient * pas * rendu public leurs résultats partiels.
@JeffE Je peux. Les gens s'en sortent tout le temps avec des choses absurdes dans le milieu universitaire. Plus important encore, est-ce quelque chose que vous voulez vraiment traiter en tant qu'étudiant diplômé, alors qu'il existe une alternative facile (attendez que le journal soit sous presse) qui ne nécessitera aucun effort, drame ou risque?
@EpiGrad: Encore une fois, je connais des cas dans mon domaine où un étudiant / postdoc a été sélectionné parce qu'il * n'a * pas * rendu public ses résultats préliminaires. (Que font les gens de votre domaine lorsqu'ils sont confrontés à des preuves de plagiat?)
@JeffE Je connais également ces exemples, mais pour être franc, ce ne sont pas des résultats initiaux. Le PO a déclaré qu'ils venaient de commencer à écrire. Mon domaine ne considère pas vraiment "Hé, j'ai eu quelques réflexions sur GitHub" comme quelque chose qui "compte" en termes d'être récupéré par des recherches concurrentes. Et bien que les gens de mon domaine fassent du bruit lorsqu'ils sont confrontés à des preuves de plagiat, ce n'est encore * pas quelque chose que je pense qu'un étudiant diplômé devrait vouloir traiter *, indépendamment de la justesse de leur position et du résultat inévitable. C'est trop une distraction pour un gain assez mince.
@JeffE Git author / commit dates sont trop faciles à définir arbitrairement pour être utilisées comme preuve - je peux créer et publier * maintenant * un commit daté d'il y a des années, et il ne sera pas distinguable d'un commit qui date en fait d'il y a des années.
user102
2012-02-25 15:54:35 UTC
view on stackexchange narkive permalink

La réponse est en deux parties:

  • Oui, c'est une très bonne idée d'utiliser un référentiel en ligne avec un système de versionnage pour rédiger votre mémoire de Master. Il offre une belle sauvegarde automatique, vous pouvez facilement synchroniser à partir de différents endroits (bureau, maison), et (c'est surtout vrai pour les papiers plutôt qu'une thèse) vous pouvez facilement collaborer avec des personnes en dehors de votre université (c'est-à-dire qui n'auraient pas un compte sur le serveur de votre université.

  • Non, ce n'est pas une bonne idée de le rendre public. Le plagiat est réel, le système de versionnage en ligne n'offre aucune véritable protection, et vous Je ne veux pas rendre la copie trop facile, surtout lorsque vous n’avez pas encore fini. Je suis tout à fait pour l’accès libre des documents terminés , que vous pouvez mettre sur arXiv, mais en ce cas, il y a un horodatage réel, et votre travail peut être indexé (par exemple, en informatique, arXiv est indexé sur DBLP).

Pour ces raisons, je J'ai personnellement utilisé pour mes articles BitBucket, qui offre gratuitement aux universitaires leur forfait illimité (référentiels publics / privés illimités, collaborateurs illimités). De cette façon, je crée un référentiel privé pour chacun de mes articles, donnez les droits d'accès à mon co-auteur. Il semble que GitHub offre également un moyen d'avoir un dépôt privé pour les universitaires: https://github.com/edu, afin que vous puissiez continuer à l'utiliser pour partager votre code open-source (par exemple) et utilisez-le avec un référentiel privé pour votre thèse.

luispedro
2012-02-29 01:17:03 UTC
view on stackexchange narkive permalink

Parlez-en à votre conseiller. Ne rendez rien qui n'a pas été publié accessible au public à leur insu. Toute autre personne qui pourrait être coauteur de vos articles pourrait également avoir son mot à dire.

Cela dit, un Le dépôt github privé est une excellente idée (j'en ai utilisé un moi-même pour ma thèse de doctorat sur &).

Piotr Migdal
2012-02-25 07:19:22 UTC
view on stackexchange narkive permalink

Code - oui, c'est une bonne idée.

PDF (peut-être avec la source LaTeX) - vous pouvez (pourquoi pas? mais plutôt comme un endroit pour le stocker et le pointer).

Cependant (pour finir), il y a plus d'endroits dédiés, par exemple:

  • opentheis - référentiel de thèses,
  • Mendeley - gestionnaire de références permettant de télécharger vos publications (y compris les thèses),
  • arXiv - base des pré-impressions (mais uniquement pour les thèses en anglais et à partir d'une liste de sujets; là, vous devez également mettre la source),
  • etc.

Lorsque vous avez l'intention de en fait, rédigez votre thèse en public - eh bien, c'est surtout à vous (c'est-à-dire si vous êtes à l'aise avec).

pas pdf, mais le répertoire de latex source
@Approximist clarifié. Pour être bref: pourquoi pas?
Par défaut, ArXiv demande la source latex et génère sa propre sortie pdf; la source latex est disponible pour la plupart des papiers ArXiv. Voir http://arxiv.org/abs/1202.2638.
user136
2012-02-25 09:10:22 UTC
view on stackexchange narkive permalink

Vous devez être très prudent. Comme d'habitude, cela dépend de votre domaine. Le mien est les mathématiques et il n'est pas rare que la question de la thèse d'un étudiant diplômé soit résolue beaucoup plus rapidement par quelqu'un de beaucoup plus avancé. Si votre thèse est accessible au public, vous augmentez les chances de cela. Ceci est plus pertinent pour ceux qui travaillent sur des recherches originales, ce qui n'est pas toujours le cas pour une thèse de maîtrise, mais gardez cela à l'esprit.

aeismail
2012-02-25 08:41:42 UTC
view on stackexchange narkive permalink

Je ne pense pas qu'il existe une bonne réponse universelle à cela. Quelques facteurs à prendre en compte lors de l'étape de préparation de la thèse:

  • Y a-t-il des problèmes de propriété intellectuelle à prendre en compte dans votre travail de thèse? Si tel est le cas, cela éviterait d’avoir un référentiel public.

  • Votre école ou institution a-t-elle des règles contre un tel comportement?

  • Votre école propose-t-elle son propre service, qui peut offrir une meilleure sécurité pour vos données?

Une fois la thèse terminée:

  • Détenez-vous les droits de propriété intellectuelle sur les documents originaux, afin de pouvoir les publier dans un référentiel?

  • La publication dans un référentiel sera-t-elle en conflit avec votre capacité à publier le travail dans des revues (vous devrez vérifier les revues en question)?

  • Votre institution offre-t-elle un service d'archivage qui permettra un tel accès?

Ivar Persson
2012-03-01 03:10:19 UTC
view on stackexchange narkive permalink

Bitbucket propose des référentiels privés illimités pour les comptes universitaires que vous pouvez obtenir en utilisant votre identifiant de messagerie uni. J'écris ma thèse de doctorat en utilisant Lyx et j'utilise Mercurial pour le contrôle de version, donc je stocke mon code dans un repo privé sur bitbucket. Je pense que le contrôle de version est indispensable pour les grands projets de recherche qui se terminent sur une longue période, donc l'utilisation d'un référentiel conviendrait évidemment parfaitement.

Mais rendre vos informations publiques ne sert à rien, ni pour vous, ni pour la communauté universitaire qui serait intéressée par vos recherches. Vous rendez quelque chose public quand il est prêt à voir la lumière du jour. Jusque-là, vous recevez des commentaires de votre superviseur et de vos collègues, et vous améliorez la qualité de votre travail jusqu'à ce qu'il soit assez bon pour être utile aux autres

Rendre public une recherche à moitié folle est un crime contre le milieu universitaire, peut avoir une mauvaise image de vous, et dans tous les cas, les conférences sont le meilleur endroit pour discuter des travaux en cours et pour que votre travail soit horodaté par un grand nombre de personnes dans votre domaine qui se connaissent, et cela peut empêcher le «scooping». Cependant, je dois dire que je suis sceptique qu'une telle chose existe même dans le monde universitaire, votre recherche ne peut être effectuée que par vous .

Les journalistes recherchent la nouveauté et peuvent donc être récupérés. Nous les universitaires, par contre, recherchons la crédibilité, qui ne vient que de connaître «votre» idée sur le bout des doigts. Si quelqu'un d'autre peut faire un travail plus crédible avec votre idée, alors il obtient le Nobel, vous obtenez la citation.



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...