Modele najlepszych praktyk dla kodu „badawczego”?

Ben

2014-05-21 23:08:42 UTC

view on stackexchange narkive permalink

Od wielu lat jestem profesjonalnym programistą, jestem także badaczem akademickim - a moje badania obejmowały wiele prac związanych z rozwojem oprogramowania.

Czasami mam wrażenie, że moje doświadczenie w branży była przeszkodą w moich badaniach, ponieważ cele pisania oprogramowania w kontekście badawczym wydają się sprzeczne z celami w przemyśle.

W przemyśle kod powinien być (najlepiej): możliwy do utrzymania, wolny od błędów, refaktoryzowany , dobrze udokumentowane, rygorystycznie przetestowane - dobra jakość - najlepsze praktyki mówią, że te rzeczy są warte czasu (zgadzam się).

W środowisku akademickim celem jest napisanie jak największej liczby wysokiej jakości artykułów naukowych w możliwie najkrótszym czasie czas. W tym kontekście kod jest napisany w celu uruchomienia eksperymentu i może już nigdy nie zostać sprawdzony (jesteśmy oceniani na podstawie naszych prac, a nie naszego kodu). Wydaje się, że nie ma motywacji do pisania przetestowanego, możliwego do utrzymania, udokumentowanego kodu - po prostu muszę go uruchomić i jak najszybciej uzyskać wynik w mojej pracy lub czymkolwiek. W konsekwencji, napisany przeze mnie kod „akademicki” jest słabej jakości - z punktu widzenia inżynierii oprogramowania.

Problem polega na tym, że spędzam zbyt dużo czasu na tworzeniu (niepotrzebnie) dostarczania mojego kodu „badawczego” do przemysłu. jakości lub publikuję prace w oparciu o kod „złej jakości” i czuję się jak oszust.

Postęp w mojej karierze zależy od tego, czy piszę „zły” kod !?

„rzemiosło” tworzenia oprogramowania to ogromny temat - ale gdzie jest najlepsza praktyka w badaniach akademickich? Nikt nie pisze testów jednostkowych dla kodu papierowego konferencji!

Czy ktoś znajduje ich w podobnej sytuacji? Czy ktoś zna formalne metodologie dla kodu „badawczego”?

Powiązane: [Dlaczego wielu utalentowanych naukowców pisze okropne oprogramowanie?] (Http://academia.stackexchange.com/questions/17781/why-do-many-talented-scientists-write-horrible-software)

@Ben Odpowiadasz na swoje pytanie (jeśli chodzi o jakość kodu i zachęty), prawda?

Jest też powiązane pytanie dotyczące SO: [Jak napisać dobry „kod badawczy”?] (Http://stackoverflow.com/questions/2685227/how-can-i-write-good-research-code)

I (także w SO): [Dobre strategie tworzenia kodu jednorazowego użytku?] (Http://stackoverflow.com/questions/1373980/good-strategies-for-developing-throwaway-code)

Myślę, że moją prawdziwą frustracją jest to, że bez sformalizowania nieco podejścia do „badań” trudno jest nauczyć się od innych dyscypliny pisania „kodu badawczego” i szerszego rzemiosła w tym kontekście. Nie ma blogów, książek, dobrych praktyk, sposobu na naukę i doskonalenie!

Dobry kod w środowisku akademickim to dokładnie to samo, co dobry kod w przemyśle. Zasadniczo są więc te same książki, blogi, najlepsze praktyki i miejsca do nauki, które powinny działać. W wielu miejscach naukowcy się go uczą, zaczynają używać języków ogólnego przeznaczenia i współpracują nad kodem w ramach VCS. Ale dopóki są opłacani i promowani za papiery (nawet z zamkniętym dostępem), a nie kod (nawet open source), kod będzie narzędziem, a nie priorytetem (niestety).

@PiotrMigdal Dobry kod robi to, co jest wymagane. Nie mniej, ale na pewno nie więcej. Jeśli budujesz jednorazowy demonstrator na konferencję przy użyciu TDD ze 100% pokryciem testów, ciągłą integracją, ścisłym śledzeniem problemów i zarządzaniem wydaniami, jesteś przesadny. Nie cały kod musi być możliwy do utrzymania, a wiele prototypów badawczych z pewnością nie musi.

Jest tu kwestia etyczna. Jeśli przedstawię wyniki w artykule i nie mam pełnego zakresu testów (kto to robi w tym kontekście?), Kod najprawdopodobniej zawiera błędy - co oznacza, że wyniki, które przedstawiam, mogą być błędne i wiem, że są w błędzie - a ja nadal publikuję artykuł. Myślę, że to część niepisanej kultury. Nie mam na myśli twierdzenia, że bije najnowocześniejsze rozwiązania, mówię o małych rozbieżnościach wydajności, bardziej ogólnie - pokrycie testu nie jest uważane za konieczne do eksperymentowania w "dobrej wierze" w CS? Przypuszczam, że zależy to od zgłoszonego wkładu.

@Ben Tak, to zależy od tego, co twierdzisz i jak wyglądałyby Twoje testy. Jeśli budujesz, powiedzmy, algorytm uczenia maszynowego i jesteś w stanie uzyskać lepsze wyniki klasyfikacji na standardowym zestawie danych niż najnowocześniejszy, wierzę ci, nawet jeśli nie masz ani jednego testu jednostkowego (ponieważ błąd jest bardzo mało prawdopodobny sklasyfikować * lepiej * niż oczekiwano).

@xLeitix Niewiele artykułów zawierających wyniki liczbowe jest powiązane z ich kodem. W przypadku symulacji numerycznych nie zawsze twierdzisz, że radzisz sobie lepiej niż oczekiwano, ale np. stwierdzić, że w takim a takim modelu parametr X jest wyższy niż w innym modelu.

@xLeitix - naprawdę dobra uwaga, całkowicie się zgadzam. Ostateczna wygrana lub ostateczne pokazanie, że technika X jest kiepska dla problemu Y - jest na miękkim podłożu.

@Ben: To zdecydowanie zależy od wniesionego wkładu. W wielu przypadkach badań CS to nie prototyp generuje wyniki w eksperymencie, ale użytkownik, który używa tego prototypu. Błędy prawdopodobnie będą obecne, ale nie mogę sobie wyobrazić żadnej sytuacji, w której mogłyby one nieuczciwie wpłynąć na wynik (zamiast być wyraźnie zarejestrowanym w eksperymencie, ponieważ „zadanie nie może zostać rozwiązane z powodu czynników zewnętrznych i nie powinno być liczone”), mniej w pozytywny sposób.

(a) Jeśli stosujesz paradygmat Agile, Twój kod „branżowy” może być znacznie bliższy kodowi „badawczemu”. Bezbłędność i dokumentacja mają, ahem, niezbyt * wysoki priorytet. (b) Open source kod badawczy (myślę konkretnie o pakietach R na CRAN) przynajmniej muszę przejść * niektóre * testy i mam większe zaufanie do "głównego" pakietów CRAN niż do niektórych (* kaszel, kaszel *) kod „branży”. Podsumowując: nie wszystko jest czarno-białe.

W wielu obszarach, jeśli kod jest twoimi rzeczywistymi badaniami (w przeciwieństwie do dowodu / obliczeń dla niektórych hipotez), to nie może być tak naprawdę źle - część * ewaluacyjna * kodu jest malutka i trywialna w porównaniu z resztą tego i można je odpowiednio przetestować; a jeśli reszta kodu zawiera błędy, cóż, nie uzyskasz dobrych wyników; a jeśli daje wymiernie dobre wyniki optymalizacji, to nawet jeśli spowodowały to jakieś dziwne i nieoczekiwane rzeczy w kodzie, to są to funkcje, a nie błędy.

_W środowisku akademickim celem jest napisanie jak największej liczby wysokiej jakości artykułów naukowych w jak najkrótszym czasie._ - [potrzebne źródło]

Istnieje * silna * motywacja do pisania przetestowanego kodu - nie chcesz zyskać reputacji osoby piszącej niepotrzebne dokumenty, ponieważ Twój błędny kod dał fałszywe wyniki!

@xLeitix: Istnieje ważny (i z mojego doświadczenia nie tak rzadki) typ „błędu”, który prowadzi do ładnie wyglądających, fałszywych wyników algorytmów uczenia maszynowego: wycieki danych między szkoleniami a przypadkami testowymi. Na przykład. z powodu pomyłki z indeksowaniem

Kolega odesłał mnie do artykułu na ten temat: http://www.plosbiology.org/article/info%3Adoi%2F10.1371%2Fjournal.pbio.1001745

@superbest +1 to pierwsza lektura wymagana dla wszystkich nowych członków mojej grupy. Od pierwszego szkicu w 2012 roku. Cytowanie: Wilson G, Aruliah DA, Brown CT, Chue Hong NP, Davis M, et al. (2014) Best Practices for Scientific Computing. PLoS Biol 12 (1): e1001745. doi: 10.1371 / journal.pbio.1001745

@David i superbest: powinieneś uczynić to odpowiedzią.

„Wydaje się, że nie ma motywacji do pisania przetestowanego, możliwego do utrzymania i udokumentowanego kodu - po prostu muszę go uruchomić i jak najszybciej uzyskać wynik w mojej pracy lub czymkolwiek innym”. Jest motywacja - chodzi o to, że badania mają być powtarzalne. Gdybyś zgłosił, że woda wyparowuje szybciej niż z powodu dziury w wiadrze, twoje odkrycia nie byłyby powtarzalne. To samo dotyczy kodu. Jeśli ktoś ponownie zaimplementuje opisane przez ciebie algorytmy i uzyska inne wyniki, to przynajmniej jeden z was złamał kod i wynik nie jest wystarczająco odtwarzalny.

Organizacja Software Carpentry może Cię zainteresować - jej celem jest szkolenie naukowców w zakresie dobrych praktyk w zakresie tworzenia oprogramowania (a także zachęcanie do kodowania jako obiektu cytowalnego w celu poprawy odtwarzalności w nauce) http://software-carpentry.org /

„W środowisku akademickim celem jest napisanie jak największej liczby wysokiej jakości artykułów naukowych w jak najkrótszym czasie”. nie jest to cytując cel, celem powinno być pisanie artykułów, które będą miały największy wpływ na dziedzinę badań, biorąc pod uwagę dostępne zasoby. Pisanie kodu, który zachęca innych do korzystania z Twoich metod, jest cennym sposobem zachęcania innych do korzystania z Twoich badań. Nie ma sensu pisać wysokiej jakości artykułów, o których nikt nie cytuje.

Jeśli napiszesz dobry kod i udostępnisz go, zwiększa to szansę na użycie go przez inne osoby (na przykład dla porównania), a tym samym potencjalnie zwiększa liczbę cytowań. I oczywiście poprawia powtarzalność twojej pracy. Wszystkie dobre powody, aby zrobić to właściwie ....

Jako zabawny kontrprzykład, istnieją projekty badawcze dotyczące oprogramowania, które nie tylko mają siłę przemysłową, ale są szeroko stosowane w przemyśle, np.LLVM, Scala, Haskell.Oczywiście w takich przypadkach można by argumentować, że jakość oprogramowania była _ częścią_ samego problemu badawczego.

Część zwykłego zestawu narzędzi branżowych, którego używamy entuzjastycznie.

Inne części są albo wolniejsze, albo mniej cenione, w tym

Inne proste rzeczy nie pojawiają się często.