Question:
Plagiat de code par un autre doctorant
Pasted
2019-03-05 19:28:25 UTC
view on stackexchange narkive permalink

Un résumé de mon parcours: j'entreprends actuellement un doctorat, mais j'ai travaillé dans le domaine de la santé pendant environ 4 à 5 ans. Pendant ce temps, j'ai développé une suite de code pour produire des résultats à partir de données de séquençage clinique (un pipeline NGS plus des étapes de filtrage).

Récemment, en cherchant des exemples de thèses de doctorat à utiliser comme base pour ma propre rédaction, je est tombé sur une thèse de doctorat récente qui contenait une référence à un compte github, qui contenait du code que j'avais écrit.

Le code du dépôt est une copie directe de plus de 97% du code que j'avais produit lors de mon emploi précédent - les 3% restants semblent être un copier-coller de lignes de mon pipeline d'origine dans un système de gestion de pipeline populaire.

modifier Je dois noter ici que ces 3% restants avaient déjà été soumis par un autre ex-collègue dans le cadre d'une qualification externe - pour laquelle J'étais l'évaluateur interne, cette personne revendiquait alors la paternité exclusive.

modifier J'aurais dû noter que le développement de ce code a commencé un an avant d'entrer dans l'emploi que j'ai mentionné, dans le cadre d'un diplôme de troisième cycle que j'ai complété, soumis ironiquement - avec des prototypes du code discuté - à la même université. Juste pour clarifier le problème de la propriété intellectuelle, l'université en question attribue la propriété à l'étudiant dans ces cas.

Il n'y a pas de référence directe à mon propre dépôt Github qui contient le code d'origine (avec GNU public licence) et aucune reconnaissance de ma paternité (je suis mentionné indirectement en tant que mainteneur du code ailleurs dans la thèse). Je ne savais pas que l'auteur de la thèse utilisait mon code dans le cadre de sa thèse.

L'auteur de la thèse était dans le même département que moi, mais n'a à aucun moment été impliqué dans le développement du code pendant que j'étais présent. Depuis, ils ont soumis et réussi leur doctorat et sont désormais employés comme postdoctorants dans le même département.

Je peux montrer le développement continu du code sur une période de 4 ans auparavant via mes logs Github. L'auteur de la thèse n'a qu'un seul commit et pas d'historique dans les logs github.

La personne en question a essentiellement écrit un chapitre de thèse basé sur l'analyse des données de séquençage que j'ai faite. Le code n'est qu'une partie de l'histoire, puisque la personne a également affirmé qu'en plus d'écrire le code, elle a utilisé le code pour produire les résultats de ce chapitre. Ils ne l'ont pas fait - puisque je sais que j'ai géré les lots en question (c'était environ 2 ans de travail).

Quelles mesures dois-je prendre (le cas échéant)!

Questions connexes: https://academia.stackexchange.com/questions/27895/when-should-you-not-report-plagiarism https://academia.stackexchange.com/questions/64183/report-blatant-self-plagiarism-à-l'éditeur-journal-ou-pubpeer https://academia.stackexchange.com/questions/59143/how-to-report-plagiarism-in-a-publication https://academia.stackexchange.com/questions/117843/que-puis-je-faire-quand-certaines-personnes-ont-volé-ma-thèse-de-master-travaille-et-la-publie-comme-t Voir aussi https://academia.stackexchange.com/questions/tagged/plagiarism
Les commentaires ne sont pas destinés à une discussion approfondie;cette conversation a été [déplacée vers le chat] (https://chat.stackexchange.com/rooms/90673/discussion-on-question-by-pasted-plagiarism-of-code-by-other-phd-student).
Vous dites "pas de référence directe à mon propre repo Github", puis "je suis mentionné indirectement en tant que mainteneur du code".Je ne comprends pas comment ils peuvent faire ce dernier sans donner une référence directe.Voulez-vous dire que leur repo n'a pas de référence directe, ou qu'ils impliquent que vous maintenez leur repo?Ou peut-être qu'ils mentionnent votre repo sans dans le texte sans citer formellement le lien?
Une chose importante reste obscure pour moi après avoir lu ceci: qui détient les droits d'auteur sur ce code?[En fonction de votre relation avec l'Uni] (https://policy.umn.edu/research/copyright) au moment où vous avez commencé à le développer, ils peuvent détenir soit des droits d'auteur, soit au moins certains droits d'utilisation et de stockage.Le droit d'auteur sur le code développé / ajouté pendant que vous étiez employé commercialement pourrait bien appartenir à votre employeur à l'époque.Si * vous * détenez le CR, vous pouvez simplement le remettre sous licence à l'Uni, ce qui résoudrait la plupart des problèmes juridiques.Si l'Uni en est propriétaire, ils peuvent faire ce qu'ils veulent.
... si votre employeur en est le propriétaire, alors l'octroi de licences et l'application sont leur problème, et les problèmes doivent leur être signalés (et j'espère bien qu'il a été mis en ligne et sous licence GPL avec leur permission ...) Si plusieurs parties en sont propriétaires, alorsla GPL devra probablement être respectée, à moins que toutes les parties ne puissent accepter une relicence.
@Pasted veuillez mettre à jour cette question avec la résolution lorsque vous l'avez.Les réponses «voici ce qui pourrait arriver si ...» sont utiles, mais c'est une question assez notable maintenant et savoir comment cela se passe réellement dans le monde réel aidera les autres sur toute la ligne.
Cinq réponses:
n00dle
2019-03-05 23:02:56 UTC
view on stackexchange narkive permalink

C'est une question délicate. Cela ressemble probablement à du plagiat académique, mais vos problèmes de licence ne résoudront probablement pas le problème au cœur de tout cela. Il y a deux côtés à cela, le côté académique (plagiat) et le côté commercial (licence). Ils sont presque entièrement séparés, donc je vais les séparer.


Réclamation académique / plagiat

Le code dans le dépôt, il y a plus de 97% de copie directe du code que j'avais produit lors de mon emploi précédent ...

Sans attribution, c'est du plagiat, et peut justifier l'annulation du doctorat, mais il s'agirait d'une procédure sérieuse car elle risque d'avoir des effets néfastes sur la vie du doctorant en question. Vous devez être sûr à 100% de ce que vous faites et de la validité de vos affirmations. Même si le cas était noir et blanc (ce que je ne pense pas nécessairement que celui-ci soit), l'Université de l'étudiant ne prendra pas à la légère l'annulation d'un doctorat car cela se répercute mal sur eux.

De plus, il semble qu'il y ait une attribution dans le travail:

La mention indirecte de mon nom est en tant que responsable et non le seul développeur

... ce qui pourrait bien être suffisant pour que l'université considère cela comme une erreur de référencement, exigeant peut-être que l'étudiant fasse un petit addendum à sa thèse.

Le code n'est qu'une partie de l'histoire, puisque la personne a également soutenu qu'en plus d'écrire le code, elle a utilisé le code pour produire les résultats de ce chapitre. Ils ne l'ont pas fait - puisque je sais que j'ai géré les lots en question (c'était environ 2 ans de travail).

Si vous pouvez le prouver, les expériences qu'ils prétendent avoir menées, que vous avez effectuées sous l'emploi de leur département sont probablement votre jambe la plus solide sur laquelle vous tenir debout. Mais vous devez avoir de bonnes preuves et être en mesure de montrer qu'ils n'ont pas mené les expériences eux-mêmes. Si le vôtre n'a pas été publié auparavant et qu'ils ont généré eux-mêmes les données à l'aide de votre code, cela peut être nul et non avenu.


Réclamation commerciale / de licence

Le point de vue des licences est complètement séparé du côté du plagiat - si le travail a été publié sous GPL, ils peuvent fondamentalement faire ce qu'ils veulent avec, sans attribution, à condition que tout code basé sur celui-ci reste GPL . Ce bit est important, car c'est probablement là que vous avez une jambe sur laquelle vous tenir, basé sur ce commentaire:

bien que la personne ait également retiré la GPL du dépôt, ce que je pensais être contre le termes de la licence

Ceci est absolument contraire aux termes, c'est pourquoi la plupart des entités industrielles ne toucheront pas au code GPL avec un bargepole (à cause de ce que l'on appelle communément "licence bleed").

Sur cette base, vous pourriez avoir une réclamation valide pour obtenir leur dépôt, mais cela ne résoudra pas votre problème réel.

Encore une fois, à partir des commentaires:

... Je pense que le superviseur (qui était mon patron) ...

Je comprends que cela signifie que le doctorant en question est supervisé par votre ancien patron, ce qui signifie que vous aviez un contrat avec leur institution. Selon le contrat que vous aviez avec eux, ils pourraient donc détenir tous les droits sur celui-ci indépendamment, faisant de votre licence GPL initiale une violation de votre contrat avec eux sans accord préalable déclaré. Cela n'affecterait pas la légitimité de votre plainte pour plagiat, car il s'agit d'une véritable préoccupation académique, mais pourrait affecter la manière dont le département traite votre demande.

+1 Je pense que cette réponse est la plus sur la bonne voie - il ne s'agit pas de savoir s'ils ont cité OP ou respecté les termes de la licence, il s'agit de savoir s'ils ont déformé la quantité de travail qu'ils avaient effectuée pour obtenir frauduleusement un doctorat.Aller voir l'ombudsman et / ou le conseiller de l'étudiant avec vos préoccupations est probablement la seule voie à suivre, même si je serais surpris si quelque chose en sortait (malheureusement).
La GPL stipule clairement: "Vous pouvez transmettre des copies textuelles du code source du Programme tel que vous le recevez, sur n'importe quel support **, à condition que vous publiiez de manière visible et appropriée sur chaque copie un avis de droit d'auteur approprié **; ** garder intactes tous les avisdéclarant que cette Licence ** et toutes les conditions non permissives ajoutées conformément à l'article 7 s'appliquent au code; conserver intactes tous les avis d'absence de garantie; ** et donner à tous les destinataires une copie de cette Licence avec le Programme **. "Voir aussi: https://opensource.stackexchange.com/a/4582
Merci pour les informations @n00dle, semble également être un bon résumé des points d'autres publications.Je suppose que le mieux que je puisse faire est de soulever le problème avec l'universitaire en charge du plagiat et de demander un examen.Compte tenu du statut de superviseur au sein du département et de la qualification de l'ex-étudiant, une claque au poignet sera le mieux que je puisse espérer - mais au moins cela signifiera qu'ils ne pourront pas prétendre avoir produit eux-mêmes le code à l'avenir.
user2768
2019-03-05 20:39:28 UTC
view on stackexchange narkive permalink

Vous voulez accuser un pair de plagiat sur la base de ce qui suit (italiques ajoutés):

Je suis tombé sur une thèse de doctorat récente qui contenait une référence à un compte github, qui contenait code que j'avais écrit ... Il n'y a pas de référence directe à mon propre dépôt Github qui contient le code original (avec licence publique GNU) et aucune reconnaissance de ma paternité ( Je suis mentionné indirectement en tant que mainteneur du code ailleurs dans la thèse ).

Vous avez déclaré que l'accusé vous a reconnu et, comme indiqué dans un commentaire, "GPL (v2, v3) ne nécessite pas d'attribution", donc l'accusé n'était pas tenu de référencer votre référentiel Github à partir du sien.

Cela ne ressemble pas à du plagiat.

Néanmoins, comme l'a noté Abion47, j'apprécie que le PO pense qu'ils ont été lésés et le PO veut comprendre ce qui s'est passé. Cela pourrait peut-être être réalisé avec un peu de fouille, par exemple en envoyant un courriel à l'accusé et en posant des questions, en s'asseyant avec l'accusé, ... Pour qu'une telle stratégie fonctionne, le PO doit entrer dans le dialogue sans présomption de culpabilité: Écoutez l'accusé, écoutez son histoire.


Réponse aux commentaires du PO :

La mention indirecte de mon nom est en tant que responsable et non le seul développeur

Cela semble être un petit problème sur le choix du mot de l'accusé.

Veuillez noter que j'insiste sur le seul développeur du code original

L'accusé n'a pas prétendu être le développeur du code (du moins, ce n'est pas mentionné dans la question d'origine).

La mention se trouve dans un autre chapitre et n'est pas dans le référentiel Github

Si la mention est dans un chapitre précédent, alors cela suffit sûrement (le code vous a été attribué, le propriétaire), sinon, eh bien, cela aurait dû l'être, mais c'est facilement expliqué (par exemple, en raison de la modification de l'ordre des chapitres). Concernant Github, nous avons établi que vous n'aviez pas besoin de mention.


Réponse aux commentaires concernant mainteneur contre développeur:

Je suis choqué que cette réponse soit [très bien notée]. Etre mentionné comme "mainteneur" est loin d'être la même chose que d'être le seul développeur. Nous pouvons parler de détails techniques toute la journée, mais l'autre élève est clairement trompeur.

et

Je suis d'accord avec les autres dans les commentaires ici pour m'en plaindre - cette personne est certainement malhonnête en désignant l'auteur réel comme le "mainteneur".

Wikipedia propose les définitions suivantes:

  • Un développeur de logiciel est une personne concernée par les facettes du développement de logiciel processus, y compris la recherche, la conception, la programmation et les tests de logiciels informatiques.

  • Un mainteneur de logiciel... est généralement une ou plusieurs personnes qui construisent le code source dans un paquet binaire pour la distribution, la validation des correctifs ou l'organisation du code dans un référentiel source

Je comprends que le terme développeur de logiciel est le plus approprié. Cependant, la langue maternelle de l'accusé n'est peut-être pas l'anglais et l'accusé (vraisemblablement) n'est pas un expert en génie logiciel (ils travaillent dans le séquençage clinique).

Je ne pense vraiment pas qu'utiliser le mainteneur par opposition au développeur est un gros problème. Je ne ferais certainement pas une affaire de plagiat sur la base d'un terme mal utilisé.

Les commentaires ne sont pas destinés à une discussion approfondie;cette conversation a été [déplacée vers le chat] (https://chat.stackexchange.com/rooms/90674/discussion-on-answer-by-user2768-plagiarism-of-code-by-other-phd-student).
Buffy
2019-03-05 19:52:22 UTC
view on stackexchange narkive permalink

Parlez à votre conseiller.

Parlez au conseiller de l'autre élève, avec votre propre soutien. Ou demandez à votre propre conseiller de porter plainte auprès de l'autre.

Plainte auprès de GitHub.

Mais, le plus important, assurez-vous que votre propre conseiller conviendra que cet autre travail, apparemment antérieur, ne préjuge pas de votre propre diplôme.

En ce qui concerne la publication, je suis presque sûr que le code prend en charge votre travail, plutôt que d'être l'essence de votre travail. Si tel est le cas, comme c'est normal, le problème du plagiat ne devrait pas affecter votre propre capacité à publier vos propres résultats.

Merci @Buffy - j'ai porté ceci à mon (mes) superviseur (s), mais ils étaient réticents à s'impliquer en raison du plagiat du travail que j'ai fait avant mon doctorat .. et de la réputation du superviseur des délinquants.Ce qui est assez juste et je comprends parfaitement.Je pourrais déposer une plainte directement, mais je pense que le superviseur (qui était mon patron) ignorerait ma plainte.L'autre recours peut être d'obtenir un examen impartial par une personne extérieure au ministère (par exemple en informatique), puis de suivre sa recommandation.
Quelle plainte peut-on adresser à GitHub?
Les [Conditions d'utilisation] de GitHub (https://help.github.com/en/articles/github-terms-of-service#2-content-restrictions) déclarent "Vous acceptez de ne pas télécharger, publier,héberger ou transmettre tout contenu qui ... porte atteinte à tout droit de propriété de toute partie, y compris un brevet, une marque, un secret commercial, un droit d'auteur, un droit de publicité ou d'autres droits. "1/2
[Aussi] (https://help.github.com/en/articles/github-terms-of-service#3-ownership-of-content-right-to-post-and-license-grants) "vous ne pourrezsoumettre du Contenu que vous avez le droit de publier et que vous vous conformerez pleinement à toute licence de tiers relative au Contenu que vous publiez. "2/2
@user2768 "Quelle plainte peut être adressée à GitHub?"Pas vraiment une plainte, mais vous pouvez déposer une demande DMCA auprès de Github.https://help.github.com/en/articles/dmca-takedown-policy En principe, c'est pour cela qu'ils sont là.Cependant, avant de le faire, il faut vérifier qu'il existe une raison substantielle à cela.
Le code d'@shoover OP a été mis sur Github sous la licence GPL, ce qui permet à n'importe qui de prendre et d'utiliser le code sans nécessiter d'attribution.En tant que tel, il n'y a aucun droit de propriété à enfreindre.
@Trilarion Il est également tout à fait plausible que le code en question n'appartienne pas légalement à OP mais à l'institution / département où OP a été employé lors de sa rédaction (c'est-à-dire que le droit d'auteur pour le code produit dans le cadre de vos tâches professionnelles dans la plupart des juridictions appartient auemployeur, `` travail contre rémunération ''; et les doctorants font souvent techniquement la recherche lorsqu'ils sont employés en tant qu'AR), et il est tout à fait dans les droits de cette institution / département que d'autres personnes utilisent et modifient ce code même s'il n'était pas autoriséune licence open source et l'auteur original s'opposerait à l'utilisation.
@Peteris Tout à fait d'accord.Avant d'agir, il faut établir minutieusement la situation juridique complète.
@Abion47 Les GPL v2 et v3 nécessitent toutes deux une attribution via au moins une notice de copyright.Voir [GPL v2] (https://www.gnu.org/licenses/old-licenses/gpl-2.0.html) § TERMES ET CONDITIONS, # 1-2;et [GPL v3] (https://www.gnu.org/licenses/gpl-3.0.html) § TERMES ET CONDITIONS, # 5.
@cpburnz Il n'est pas mentionné si le dépôt de l'autre étudiant inclut un avis de droit d'auteur à cet effet.Même s'ils ne le faisaient pas, cela constituerait simplement une violation des conditions de licence, dont je ne connais pas les répercussions.Mais ce ne serait toujours pas nécessairement une instance de plagiat, puisque l'autre étudiant ne revendique pas la paternité du code (pour autant que je sache).
user22485
2019-03-05 20:22:17 UTC
view on stackexchange narkive permalink

Ne fais rien.

Vous avez fourni du code qui s'est retrouvé en ligne.

Cette personne a profité de votre code, mais je suis sûr qu'une grande partie de ce qu'elle a fait était plus qu'un simple code.

Soyez plus généreux.

Si quelqu'un avait utilisé mon code pour une recherche réussie, j'en serais ravi!

La personne en question travaillait dans le même département que moi et a essentiellement écrit un chapitre de thèse basé sur l'analyse des données de séquençage que j'ai faite.Le code n'est qu'une partie de l'histoire, puisque la personne a également affirmé qu'en plus d'écrire le code, elle a utilisé le code pour produire les résultats de ce chapitre.Ils ne l'ont pas fait - puisque je sais que j'ai géré les lots en question (c'était environ 2 ans de travail).Je me demande si vous seriez aussi heureux qu'un collègue utilise votre travail sans attribution - c'est en quelque sorte un principe fondamental de la science de reconnaître le travail des autres!
Ok, veuillez adapter votre question pour tenir compte des informations supplémentaires contenues dans ce commentaire.Je suis d'accord avec vous, mais en même temps, mon code ne se retrouverait sur un site Web qu'après avoir publié quelque chose.Ensuite, vous auriez un argument beaucoup plus valable et ce serait beaucoup plus facile à prouver.
Merci @zarina Je vais ajouter les détails supplémentaires dans - je ne voulais pas mettre trop de détails dans la question, puisque la personne en question est maintenant un chercheur actif.
@Pasted "puisque la personne a également affirmé qu'en plus d'écrire le code, elle a utilisé le code pour produire les résultats dans ce chapitre" S'ils ont affirmé directement, ils ont écrit le code qui doit être ajouté à la question.De plus, s'ils prétendent directement avoir fait le travail que vous avez réellement fait, cela doit également être ajouté à la question.
mathreadler
2019-03-06 19:39:59 UTC
view on stackexchange narkive permalink

Si le code a été produit sous un autre emploi , cette question ne concerne pas principalement le plagiat académique mais plutôt le vol potentiel de propriété intellectuelle de cette entreprise. Soit par vous si vous l'avez utilisé sans y avoir été autorisé par votre ancien employeur ou par cet autre étudiant qui n'avait demandé ni à cette entreprise ni à vous.

Le pipeline initial et le code de filtrage ont été produits dans le cadre d'une qualification de troisième cycle que j'ai entreprise ** avant ** d'entrer en emploi chez cet employeur particulier.Depuis ce temps, le code a été développé, bien que j'aie conservé le statut d'associé avec mon ancienne université.Notez que le diplôme de troisième cycle était autofinancé.Le code et les concepts sont antérieurs à mon emploi, bien que les données de cet employeur aient été utilisées dans le cadre du processus de développement.Il n'y a pas eu de discussion explicite sur les droits de propriété intellectuelle ni sur aucun contrat signé.
@Pasted ok alors je suppose que j'ai mal compris la situation.
Je suppose que je peux renverser la vapeur et demander puisque le code a été développé et fonctionnait avant mon emploi, et c'est essentiel pour la principale génération de revenus du ministère, s'ils me donnent une partie de ces revenus!Il est certain que mon ex-employeur avait des lignes directrices spécifiques à cet effet.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 4.0 sous laquelle il est distribué.
Loading...