Pytanie:
Amerykański system oceniania: Dlaczego oceny dyskretne?
Martin Van der Linden
2018-09-19 22:02:07 UTC
view on stackexchange narkive permalink

Tło

W Stanach Zjednoczonych wiele uczelni przyjmuje schemat oceniania od A do F, uzupełniony o plusy i minusy.

Profesorowie różnią się pod względem przypisywania ocen od A do F, ale mój zmysł opiera się głównie na dyskretnych „pojemnikach”. Na przykład niektórzy profesorowie stosują względne oceny i (z grubsza) dają ocenę A najwyższej trzeciej lub klasie, B drugiej tercji itd. Inni przyznają ocenę A studentom, którzy zajmują od 100% do 95% , oraz A− dla uczniów między 94% a 90%, B + dla uczniów między 86% a 89%, itd.

Korzystanie z oddzielnych pojemników nieuchronnie implikuje ostre przypadki, w których uczeń jest tuż przy graniczy z następnym koszem, a uczniowi zajęłoby bardzo niewiele, aby wskoczyć do następnego kosza i poprawić ocenę z liter o jeden „poziom”.

Wszystko byłoby w porządku (chyba), gdyby litery, w których były tylko tytuły honorowe, a liczył się faktyczny wynik procentowy. Jednak w większości miejsc (tj. We wszystkich miejscach, które znam), to ocena listowa - a nigdy sama ocena procentowa - jest dołączana do wyników w nauce ucznia.

Może to być problem per se , jeśli uczeń chciałby wykazać się biegłością w określonym temacie i uzyskał, na przykład, ocenę A−, która była w rzeczywistości bardzo bliska A. Wyniki akademickie tego ucznia zawsze będą pokazywać bardzo dobre ale nie idealne dla tego kursu, podczas gdy powinno to oznaczać prawie idealne . Stwarza to zrozumiałą frustrację uczniów, którym prawie się to udało.

Sprawy stają się jeszcze gorsze, gdy uśredniamy różne kursy i obliczamy GPA, ponieważ większość uczelni stosuje schemat podobny do poniższego:

  • Odp .: 4,00
  • A−: 3,67
  • B +: 3,33
  • B: 3,00
  • B−: 2,67
  • C +: 2.33

Znowu oznacza to, że pół procenta, którego uczeń potrzebuje, aby przeskoczyć z punktu A do A, będzie miało znaczący wpływ na jego średnią ocen, podczas gdy tak naprawdę efekt zdobycia pół procentu więcej powinien być nieistotny niezależnie od wyjściowego odsetka, od którego się zaczyna.

W świecie, w którym GPA są traktowane tak poważnie, oznacza to, że połowa procenta może mieć znaczący wpływ na życie i karierę studenta. Ponownie, może to wywołać zrozumiałą frustrację uczniów, którym prawie się to udało.

Moje pytanie

Wiem, że istnieją „środki łagodzące”, które pozwalają radzić sobie z dyskretną skalą ocen i unikać niektórych z nich przypadki ostrego noża, takie jak zaokrąglanie liczb dziesiętnych w górę. Mówiąc uczciwie, nie sądzę, żeby to były prawdziwe rozwiązania (zaokrąglanie liczb dziesiętnych po prostu przenosi problem z jednego progu do drugiego), ale nie mnie to interesuje.

Chciałbym wiedzieć:

  • Czy są jakieś argumenty przemawiające za zastosowaniem dyskretnego schematu oceniania, takiego jak powyższy?
  • Czy jest to po prostu iloczyn historii i trudności w koordynowaniu praktyk w ogromnej liczbie uczelni w USA?

Innymi słowy, czy ktoś twierdzi, że skala dyskretna ma swoje zalety inne niż fakt, że jest używana w tak wielu miejscach - tworząc porównywalność - i że trudno byłoby skoordynować zmianę we wszystkich tych miejscach naraz?

Cóż, zaprzeczam, że „GPA są traktowane tak poważnie”, ale dygresję.Zawsze myślałem o tym w ten sposób, że „Czy 92 rzeczywiście jest znacznie lepsze niż 91, jeśli transkrypcja powinna to odzwierciedlać”?Zasadniczo odzwierciedla fakt, że GPA nie są zbyt wrażliwe, ponieważ nie przeceniają swojej precyzji.I jak zauważyłeś, skrajne przypadki są tego niefortunnym produktem ubocznym.
Poza tym ten system nie jest unikalny dla Stanów Zjednoczonych (Kanada też to robi) ... możesz po prostu zapytać o skale dyskretne, zamiast pytać tylko o USA
* Wyniki akademickie tego studenta zawsze będą wskazywały na „bardzo dobre, ale nie doskonałe” dla tego kursu, podczas gdy powinno to naprawdę wskazywać na „prawie doskonały”. * Nie rozumiem twojej logiki, ponieważ samo A nie oznacza „doskonały”.
Myśl na A - oznaczająca „prawie doskonały” jest osobliwa.Gdybym powiedział, że ktoś uzyskał w klasie 91,273%, czy nie byłoby to jeszcze bardziej dobitnie „bardzo dobrze, ale nie idealnie”?
Dyskretna skala jest niezbędna, aby odróżnić przynajmniej „zaliczenie” i „niepowodzenie”
Ile cyfr znaczących chcesz zachować?Jeśli nie jest nieskończona, nadal istnieje dyskretna liczba pojemników, z których wiele nie jest szczególnie przydatnych.
@Vladhagen - lata temu miałem ~ 30% średnią na zajęciach z fizyki.To było solidne A. Kolejny powód, dla którego oceny, a nie surowe liczby, są złe ...
@JonCuster Biorę całkowicie odwrotną lekcję z twojego doświadczenia.Egzaminator oczywiście postawił nieoczekiwanie trudny egzamin, więc wszyscy otrzymali nieoczekiwanie niskie oceny - jednak ocenę można było znormalizować, aby można ją było porównać z innymi studentami z innych kursów.
Brytyjskie uniwersytety przyznają stopnie licencjackie w czterech klasach: pierwszej, wyższej drugiej (aka 2.1 lub dwa-jeden), dolnej drugiej (aka 2.2 lub dwa-dwa), trzeciej.Mojemu ojcu powiedziano, że ma najwyższe 2,1 na uniwersytecie (prawdopodobnie z jego przedmiotu);wolałby raczej mieć najpierw najniższy!(Myślę, że w dzisiejszych czasach odnotowują również rzeczywiste ślady).
@MartinBonner - właściwie było to całkowicie oczekiwane i to była moja średnia z całego kursu.Profesor nie spodziewał się, że student całkowicie rozwiąże jakikolwiek problem, chociaż czasami tak było.Chodziło o to, żeby zobaczyć, jak daleko można się dostać.Wszystkie stopnie można znormalizować, co sprawia, że ograniczona liczba oddzielnych stopni jest jeszcze bardziej pożądana, zabraniając niektórym krajowym przepisom _jak_ ich znormalizować.
Numeryczna ocena za esej, pracę naukową, rzeźbę itp. To po prostu bzdura.Przynajmniej musisz ograniczyć wyniki liczbowe do tych tematów, które można obiektywnie ocenić, a nawet wtedy jest dużo błędów.
Oto [odpowiednie zadanie] (https://unfamiliarplace.com/wp-content/uploads/2018/09/Grading-scales-and-degrees-of-fineness.pdf) z zajęć, które zaliczyłem podczas oceniania w moim programie nauczania.Niezbyt szczegółowe, ale mam nadzieję, że coś tam pożytecznego.N.B.Ten kurs nie przyniósł mojej najlepszej pracy.: p
Trzynaście odpowiedzi:
Vladhagen
2018-09-19 22:32:59 UTC
view on stackexchange narkive permalink

Jestem zwolennikiem korzystania z amerykańskiego systemu ocen dyskretnych. Niektóre przemyślenia, które omówię, są następujące:

Jak wspomniano w OP, w Stanach Zjednoczonych system ocen ABC jest stosunkowo ustandaryzowany i dobrze rozumiany przez wiele różnych instytucji. To sprawia, że ​​porównania między uczniami z różnych szkół są bardziej kompatybilne (chociaż tak, nie do końca porównywalne).

Poza tym uważam, że system ABC zapewnia odpowiednią szczegółowość. W końcu musisz gdzieś skrócić procenty ocen. W pewnym sensie każdy system jest dyskretny .

Jedną z metod, których użyłem dla moich uczniów na lekcjach matematyki w USA, jest system grupowania oparty na końcowych ocenach. Podane procenty są gwarancjami. Potem dzielę uczniów na klasy, przy czym uczniowie, którzy ledwo przeoczyli granicę, nadal zwykle się dostosowują. Na przykład, powiedzmy, że mamy następujące wartości procentowe:

93,23%, 93,17%, 92,88%, 92,81%, 92,08%

Podałbym pierwszych czterech uczniów A, a ostatni uczeń A- w normalnych okolicznościach. (Zwykle jest bardziej zniuansowany). Wydaje mi się, że oceny, które wystawiłam moim studentom, zazwyczaj bardzo dokładnie opisywały ich biegłość w stosunku do deklarowanych efektów kursu. Było to również prawdą, kiedy byłem studentem. W rzeczywistości były chwile, kiedy wolałbym zdać ocenę A niż mój surowy procent. „A” brzmi znacznie lepiej niż „Dostałem 83% w stanie surowym, ale byłem drugą najwyższą oceną w kursie”.

Moim zdaniem system ABC jest w rzeczywistości silniejszy system niż surowy system procentowy. Czy 95% w klasie Rachunku I doktora Haskina jest lepsze niż 97% w kursie Rachunku I doktora Bodrela? Oba dałyby ocenę A. Albo jak 97% w Calculus porównałbym do 97% w Floral Design? Korzystając z systemu ABC, skutecznie uruchamiamy rodzaj filtru „dolnoprzepustowego” na ocenach. Moim zdaniem pozwala to na bardziej sprawiedliwe porównanie uczniów.

Dodam również, że posiadanie surowego systemu procentowego byłoby okropne z perspektywy instruktora. Uczniowie i tak martwią się swoimi ocenami. A teraz wyobraź sobie, że musieliby się męczyć nie tylko o zdobyciu szóstki, ale o 100%. Skończyło się na tym, że uczniowie z 98% na kursie martwiliby się o zdobycie 99%. Po prostu staje się nadmiernie kłopotliwa. Jako były student nienawidziłbym surowego systemu. Byłem wdzięczny, że mogłem uzyskać ocenę A z 94% w klasie, bez martwienia się o podniesienie jej do 95%.

Na zakończenie powiem, że szkoła i oceny nie zawsze są uczciwe . Takie jest życie. Bez względu na to, jakiego systemu używasz, z takiej czy innej perspektywy będą występować wady. Nie ma systemu, który byłby doskonały.


Dodatek: W kilku komentarzach wspomniano o przemyśleniach na temat oceniania w stosunku do innych. Zauważ najpierw, że proponowana przeze mnie metoda nigdy nie przenosi ucznia w dół o jedną ocenę, tylko w górę. Wydaje się, że kilka komentarzy to przeoczono.

@BartoszKP: „Oceniasz nie„ ich biegłość w stosunku do podanych wyników ”, ale„ ich biegłość w stosunku do podanych wyników i w stosunku do innych uczniów ”. Czy inni studenci, którzy radzili sobie dobrze, sprawili, że ten uczeń nagle wiedział mniej?

W jaki sposób podniesienie oceny może wskazywać, że uczeń „wiedział mniej”? Wydaje się, że podniesienie oceny w rzeczywistości wskazywałoby, że uczeń wiedział więcej .

Myślę, że mógłbym oceniać uczniów wyłącznie na podstawie ich surowych wyników, niech to szlag trafia setne części procenta. Wtedy uczniowie byliby oceniani z mniejszą względnością w stosunku do rówieśników. Ale czy taka „zerowa tolerancja zaokrąglania” nie była jedną z wymienionych wad systemu ABC? Wygląda na to, że próbujemy grać tutaj na obu końcach fletu. Widzę, że byłoby ewidentnie niesprawiedliwe, gdybym zaokrąglał uczniów o jedną ocenę. Muszę jednak powiedzieć, że nigdy nie zdarzyło mi się, aby uczeń narzekał, że został oceniony jako „względny” w stosunku do swoich rówieśników, kiedy zaokrągliłem ich nieznacznie w górę.

Po drugie, aby kontynuować myślenie o ocenianiu w stosunku do rówieśników, musimy pamiętać, że prawie niemożliwe jest zapewnienie studentom z obecnych semestrów identycznego doświadczenia egzaminacyjnego jako napotkani studenci z poprzednich semestrów. Dostosowując wyniki w trakcie semestru, może to pomóc w kontrolowaniu niewielkich różnic w trudności egzaminów z semestru na semestr. Zwróć uwagę, że nie zawsze mam pełną kontrolę nad egzaminami, ponieważ często muszą być napisane w zespołach z innymi profesorami. Podsumowując, który system wydaje się bardziej „sprawiedliwy”, system, który w ogóle nie kontroluje zmienności stylów pisania egzaminów, czy też system, który próbuje to uwzględnić?

Komentarze nie służą do rozszerzonej dyskusji;ta rozmowa została [przeniesiona do czatu] (https://chat.stackexchange.com/rooms/83475/discussion-on-answer-by-vladhagen-u-s-grading-system-why-discrete-grades).Jeśli chcesz wypracować kontrastujące stanowisko, napisz wyraźną odpowiedź na to lub inne pytanie (w stosownych przypadkach).Przeczytaj [to FAQ] (https://academia.meta.stackexchange.com/q/4230/7734) przed opublikowaniem kolejnego komentarza.
Naprawdę doceniam wszystko, co ma w sobie „Jako były student ...” :)
Dan Romik
2018-09-19 22:51:29 UTC
view on stackexchange narkive permalink

Stwarza to zrozumiałą frustrację uczniów, którym „prawie się to udało”.

Warto pamiętać, że wyniki życiowe są również dyskretne, a powoduje to również podobne frustracje wśród uczniów (i wszystkich innych): albo otrzymujesz stypendium / przyjęcie do szkoły wyższej / pracę / awans / cokolwiek, albo nie. Tak więc uczniowie nadal doświadczaliby tych samych frustracji, nawet przy ciągłych ocenach, a nawet przy całkowicie nierealistycznym założeniu, że ich oceny są idealnie dokładnym narzędziem do pomiaru ich poziomu wiedzy, czym oczywiście nie są.

Ja Sam nie jestem wielkim fanem amerykańskiego systemu oceniania, ale szczerze mówiąc, nie wydaje mi się, aby miało to duże znaczenie, czy ocenianie odbywa się w skali ciągłej czy dyskretnej. Oceny są narzędziem statystycznym i powinny być tak interpretowane - uśrednione w wielu punktach mają pewne (ograniczone) znaczenie, ale jakakolwiek indywidualna ocena nie musi mieć dużego znaczenia.

Kevin
2018-09-20 02:29:15 UTC
view on stackexchange narkive permalink

W przypadku przytłaczającej większości klas ocena jest przynajmniej częściowo subiektywna. W przypadku zajęć esejowych jest to od razu oczywiste. Podobnie na zajęciach plastycznych. Jednak nawet w przypadku matematyki i nauk ścisłych istnieje element, w którym oceniający muszą dokonać najlepszej oceny. Kiedy student rozwiązuje równanie niepoprawnie, ale jego jedynym błędem było upuszczenie znaku głęboko w chwasty całej strony algebry, czy odejmujesz 1% lub 2% częściowego zaliczenia? Jeśli raport laboratoryjny nie miał oczekiwanej dokładności danych, ale mieścił się w zakresie jednej znaczącej cyfry, jak źle oceniasz ucznia?

W rezultacie dokładny czterocyfrowy wynik nieprzetworzony procentowa ocena, jaką otrzymujesz na zajęciach, sprawia wrażenie niezwykle precyzyjnego pomiaru, ale w rzeczywistości tak nie jest. W zależności od tego, jak oceniający czuli się i myśleli, kiedy patrzyli na twoje projekty i testy, twoja ocena mogłaby prawdopodobnie wzrosnąć lub spaść o cały punkt procentowy lub dwa, gdy sam oddałeś dokładnie tę samą pracę. Zakładanie, że twój surowy stopień jest idealnie dokładny, jest bardzo podobny do czytania, że ​​Ziemia ma 25 tysięcy mil w obwodzie i zakładania, że ​​ta liczba jest dokładna do cala.

Z tego powodu argumentowałbym, że dyskretna litera- oparty na ocenie system jest w rzeczywistości bardziej wiarygodnym miernikiem wydajności, który nie przesadza z jego dokładnością. Odległość między częściowymi ocenami literowymi jest mniej więcej taka sama, jak margines błędu, który dałbym surowym ocenom procentowym. Po przekonwertowaniu oceny surowej na ocenę literową możesz być pewien, że ocena, którą otrzymałeś, jest bardzo prawdopodobna, nawet biorąc pod uwagę subiektywność, niejasność i niewielką przypadkowość przypisywania ocen procentowych.

Daniel R. Collins
2018-09-19 22:50:24 UTC
view on stackexchange narkive permalink

Rozważ perspektywę czytelnika transkrypcji. Są zainteresowani zeskanowaniem transkrypcji szkolnej z zapisami może 30 lub 40 lekcji (na tytuł licencjata), z może połową z tych na specjalności, tak szybko i skutecznie, jak to możliwe. Fakt, że istnieje niewielka liczba różnych znaków, pomaga w analizowaniu rekordu.

  1. Schemat A-F to tylko jeden glif na klasę, zamiast dwóch (lub trzech) dla systemu od 0 do 100.
  2. Szczegółowość ocen literowych jest całkowicie przydatna dla czytelnika; Wątpliwe jest, aby czytelnikowi zależało na różnicy między 85% a 86%, a więc jednomiejscowa cyfra jest często po prostu zmarnowaną przestrzenią i zmęczeniem oczu.
  3. System AF wydaje się zgodny z zasadą „Magiczna liczba siedem, plus lub minus dwa”, która mówi, że z psychologicznego punktu widzenia ludzie mogą w skrócie żonglować i oceniać około 5-9 dyskretnych rzeczy- pamięć terminów naraz.

Ponadto wiele klas innych niż STEM ma z natury jakościowe oceny zadań, osiągnięć itp. Rozważ np. zasady wymienione dla Ocena w Yale. Pierwszy wymieniony protokół to „Oceny literowe dla wszystkich przydziałów”; drugi wymieniony protokół to „Numeryczne oceny wszystkich zadań” i zapewnia, że ​​jest to standard tylko dla kursów STEM. Tak więc w pierwszym (prawdopodobnie bardziej powszechnym) przypadku podanie liczby na końcu kursu z dwucyfrową dokładnością byłoby puste.

Myślę, że twój punkt 1 jest błędny.Ludzie nie czytają glifów: rozpoznają większe struktury, a taką właśnie strukturą jest dwucyfrowa liczba.Dlatego tak trudno jest odczytać wielkie litery: ponieważ nie możesz już rozpoznać wzorców w słowach, jesteś zmuszony do czytania litera po literze, jak pięciolatek.
@DavidRicherby Oczywiście z mojego doświadczenia wynika, że odczyt dwucyfrowych wyników jest trudny na równi z odczytaniem wszystkich liter, co prawdopodobnie mieści się między punktem 1 a punktem 2. Rozważmy 99, 98, 99, 97, 98, 97, 99, 99, 89, 99, 98, 97. w porównaniu z AAAAAAABA A. Uważam, że to drugie znacznie ułatwia dostrzeżenie znaczącej wartości odstającej.
@DavidRicherby: Nie zgadzam się.Przetwarzanie liczby takiej jak „97” nie przypomina rozpoznawania słowa „truskawka”.Liczbowe i językowe struktury mentalne nakładają się, ale nie są identyczne.Na przykład istnieją badania, które pokazują, że mentalne porównywanie liczb dwucyfrowych jest wolniejsze niż porównywanie liczb jednocyfrowych (co musi mieć miejsce w obliczeniach).
Bardzo dobrze, że nie wszystkim pracom przypisuje się skalę numeryczną.Było to bardzo powszechne na moich zajęciach ze sztuki w pracowni i osobiście łatwiej mi jest, gdy oceniam wypracowania, nadawać rzeczom ocenę A - wyjątkową, B - dobrą, C - akceptowalną, a potem skupiam się nie tyle na uzasadnieniu92,5 vs 94,25, jeśli chodzi o udzielanie przydatnych informacji zwrotnych.
@CortAmmon dzieje się tak, ponieważ współczesne cyfry są zasadniczo „kapslami” liczb.W przypadku czcionki, która ma cyfry w starym stylu (https://en.wikipedia.org/wiki/Text_figures), byłoby trochę łatwiej.
Buffy
2018-09-19 22:24:46 UTC
view on stackexchange narkive permalink

Występuje tu kilka problemów. Jednym z nich jest jednak to, że podana przez Ciebie tabela nie wydaje mi się dokładna - a przynajmniej jestem prawie pewien, że nie jest używana przez większość amerykańskich uczelni.

Po drugie, twoje twierdzenie, że uczeń może „przegapić” wyższą ocenę w niewielkiej ilości, chociaż jest prawdziwe w teorii, jest mniej prawdziwe w praktyce. Na przykład nigdy do tego nie dopuściłem, zawsze dając studentom korzyści, jeśli suma punktów za kurs nieznacznie różniła się od punktów innego ucznia, który uzyskał wyższą ocenę.

Po trzecie, zgodnie z tradycją A oznacza „najlepszy rodzaj”, B oznacza „dobry, ale nie najlepszy rodzaj”, C oznacza „akceptowalny”, a D oznacza „wymaga poprawy”. Tak, to są kosze, ale nie sądzę, żebym mógł stwierdzić, że osoba z 3,22 jest w jakikolwiek sposób lepsza niż osoba z 3,20. Środki, za pomocą których przypisuję oceny, nie są tak precyzyjne. Ocena jest sumą, a nie miarą absolutnie precyzyjną. Więc nie potrafię nawet dokładnie tego rozróżnić między studentami.

Po czwarte, jeśli porównamy różne kursy, nawet prowadzone przez tego samego profesora, ale w szczególności przez różnych profesorów z być może różnych dziedzin, oznacza to, że 3,22 oznacza to samo. To 3,22 na podstawowym kursie filozofii, dokładnie tak samo jak 3,22 na zaawansowanym kursie matematyki. IMO byłoby głupotą twierdzić, że są takie same.

Wszystko powyższe wskazuje, że rzeczywiście, oceny to tylko pojemniki. A pojemniki są na tyle dokładne, że na przykład pracodawca lub system przyjęć do szkół wyższych może wydawać uzasadnione oceny dotyczące perspektyw studenta. Oczywiście są wyjątki, ale zasadniczo proste pojemniki lepiej odzwierciedlają rzeczywistość niż podawanie dokładnej miary czemuś, co nie jest.

Nie myl dokładności z precyzją .


Zwróć także uwagę na psychologiczny efekt „klasyfikacji binningowej”. Jeśli uczeń zda sobie sprawę, że przy odrobinie większego wysiłku może podnieść ocenę z B + do A-, może po prostu chcieć włożyć ten wysiłek. To nie nastąpi w przypadku ocen, które są czysto numeryczne.

Tak jak FYI zdarza się, że brakuje wyższej oceny.Miałem zajęcia z fizyki z 3 semestrami, 1 finał.95%, 100%, 95%, 100%.Przegapiłem recytację i nie miałem wymówki od lekarza, dostałem 0 na tym.Moja ostatnia ocena wyniosła 92,49%.Departament * odmówił * zaokrąglenia do A, mimo że znajdował się o 1/100 punktu procentowego od wartości granicznej i uzyskał prostą A na każdym egzaminie oraz doskonały wynik końcowy.To była duża szkoła państwowa i takie rzeczy nie były bynajmniej rzadkością.Może to być bardzo frustrujące, ale nadal zgadzam się, że wolę to od surowego systemu.
@brenzo To prawie brzmi jak kwestia administracyjnego uporu, a nie nieodłączna kwestia dobrze zarządzanego systemu klasyfikacji ABC.Nie wiem, dlaczego działy w ten sposób kopią im po piętach.Wydaje mi się, że to coś w rodzaju „zsuń się o cal, przesuń milę”.
@brenzo, faktycznie, departament był niewłaściwym miejscem do dochodzenia odszkodowania.Pierwotnie powinien się tym zająć członek wydziału.To on był nierozsądny.Katedra prawie nigdy nie zmienia stopnia profesora i prawdopodobnie nie powinna.
Tak, to było około 5 lat temu.Rzeczywiście, wysłałem e-maila bezpośrednio do profesora, a on odpowiedział, że polityka wydziału nigdy nie zmienia oceny, a nawet udzielałby odpowiedzi szefowi wydziału.Jestem całkowicie przekonany, że mógł, ale w tym momencie jest to starożytna historia.;) To była dobra lekcja życiowa do nauczenia - czasami trzeba po prostu zaakceptować rzeczy takimi, jakie są i iść dalej.
@brenzo „polityka departamentu nigdy nie zmieniała stopnia” To nie ma większego sensu.A co, jeśli w ocenie był błąd?
@user76284 Miało to oczywiście miejsce w kontekście prawidłowo obliczonej oceny.
@brenzo: Ale normalne zaokrąglenie na poziomie 92,49% jest w dół, do 92%.Chcesz jakiegoś wstępnego zaokrąglenia na swoją korzyść przed faktycznym zaokrągleniem?
@DanielR.Collins Prawidłowo w zaokrągleniu.Zaokrąglenie z 92,50 jest w górę, do 93. Co wpada do wiadra A zamiast A-.Każdy, kto otrzyma 92,50 otrzyma ocenę A. Mój argument był taki, że otrzymanie A na każdym egzaminie, posiadanie doskonałego finału, będącego 1/100 punktu procentowego od wspomnianego A, i obniżenie do A- tylko dla jednej instancji obecnościnie wykazać, że brakowało mi wiedzy na temat materiału kursu, ale zamiast tego byłem biurokratycznym nonsensem i byłem uparty.Zamiast tego powinny stanowić okoliczności łagodzące.Oczywiście jaśniej sformułowałem swoją prośbę.
Więc tak, były „technicznie” poprawne, ale jest więcej niż jeden sposób, aby być poprawnym, z których niektóre wymagają więcej zdrowego rozsądku niż inne.https://xkcd.com/1475/
@brenzo: Nie byłeś 1/100 punktu procentowego od A. Oddaliłeś się o 51/100 punktów procentowych od A. Gdzieś jest uczeń, który zrobił wszystko, co zrobiłeś i miał doskonałą frekwencję i uważa, że powinien mieć wyższą ocenę niżzrobiłeś.
Mówisz „nigdy na to nie pozwoliłem”, ponieważ przesuwasz uczniów blisko granicy w górę.Ale jest to równoważne przesunięciu granicy w dół.Nadal jest twarda granica, a niektórzy uczniowie będą tuż poniżej tej wartości granicznej.
Jamie Clinton
2018-09-20 02:29:09 UTC
view on stackexchange narkive permalink

Pół procenta może mieć znaczący wpływ na życie i karierę studenta.

Tutaj się mylisz. Różnica między A- a B +, A + lub A itd. nigdy nie zmieni twojego życia .

Dzieje się tak, ponieważ:

  • Ta zmienność cofnie się do średniej w każdej karierze studenckiej

  • GPA ma prawdopodobnie najniższy stosunek rzeczywiste_ważenie / dane_ważność spośród wszystkiego, co kiedykolwiek spotkałeś Twoje życie. To prawie całkowicie nieistotne, skoro nie musisz już składać podania na uczelnie.

  • Dlaczego więc istnieją odrębne oceny literowe? Ponieważ są łatwe do zrozumienia i porównania, ale przede wszystkim dlatego, że to nie ma znaczenia . Oceny nie określają, kim jesteś. Są niedokładnym i drugorzędnym wskaźnikiem tego, kim możesz się stać, i są przydatne do segregowania uczniów na ich uczelnie, ni mniej, ni więcej.

    „[GPA] jest prawie całkowicie bez znaczenia, skoro nie musisz już składać podania o przyjęcie na studia”.Jasne, a umiejętności twojego kardiochirurga są prawie całkowicie bez znaczenia, kiedy nie jesteś już na sali operacyjnej.Ale to jest cholernie ważne, kiedy _ jesteś_ na tym etapie swojego życia, a ta faza twojego życia ma dość cholernie ważny wpływ na resztę twojego życia ...
    Myślę, że GPA może być bardzo ważne, jeśli ktoś chce pracować w środowisku akademickim (lub akademickim).Tak się składa, że to prawie wszyscy tutaj.
    _Ale to jest cholernie ważne, kiedy jesteś na tym etapie swojego życia_ - Nie, naprawdę tak nie jest.
    Punkt pierwszy jest ważny i zgadzam się z ostatnim akapitem.Ale czy możemy odnieść się do pierwszego zdania?Co się stanie, jeśli oceniasz kurs, aby spełnić jakieś ustawowe wymagania, otrzymać stypendium lub ubiegać się o dofinansowanie?Na przykład rozważ ukończenie ostatniego semestru na studiach licencjackich lub magisterskich i umieszczenie o jeden stopień za nisko, aby ukończyć studia.Przydarzyło się to mojemu przyjacielowi.Powiedziałbym, że spowodowało to znaczącą zmianę ekonomiczną w jej życiu.
    gpa cię nie definiuje, ty definiujesz swoje gpa.Jest to efekt uboczny tego, kim jesteś, a nie definicja tego, kim jesteś.
    ZeroTheHero
    2018-09-20 08:04:55 UTC
    view on stackexchange narkive permalink

    Właściwie uważam, że system ocen listowych jest bardzo dobry. Po pierwsze, czyni oceny porównawcze w tym sensie, że - przynajmniej w zasadzie - najlepszy uczeń w klasie może uzyskać ocenę A +, nawet jeśli ocena liczbowa nie jest> 95. Po drugie, podczas gdy studenci mogą mieć pecha na niektórych kursach i po prostu przegapić próg, na innych będą mieli szczęście i będą po prostu powyżej progu: ma tendencję do uśredniania się w czasie studiów.

    Najważniejsze w myślę, że system binningowy oddaje rzeczywistość, w której znaki numeryczne są zbyt szczegółowe: nie ma istotnej różnicy w poziomie kompetencji między uczniem z 89% a uczniem z 90%. Schemat oznaczania nie jest tak dokładny, a różnica w oznaczeniach może wynikać z jakiegoś trywialnego czynnika, takiego jak zmęczenie części markera lub stronniczości, takiej jak oznaczenie wielu bardzo dobrych kopii przed oznaczeniem nieco mniej dobrej kopii itp.

    IMO są nadmiernie zafascynowani ocenami liczbowymi, a to sortowanie - w szczególności możliwość przypisania A + niezależnie od rzeczywistej oceny liczbowej - jest dobrym ogólnym sposobem oceny uczniów w grupie rówieśniczej.

    paul garrett
    2018-09-20 03:20:53 UTC
    view on stackexchange narkive permalink

    Aby krótko powtórzyć inne odpowiedzi:

    Zawartość informacyjna (w sensie teorii informacji) „dokładnych ocen numerycznych” jest znacznie niższa, niż mogłoby się wydawać, nawet poza całkowitym brakiem informacji na temat rzekome znaczenie liczb na danym poziomie.

    Najwyraźniej wielu ludzi uważa, że ​​„oceny literowe” są „absolutne” i rozwiązują (!?) niejasności i zależność ocen liczbowych od kontekstu. Oczywiście po pierwsze nie jest to prawdą, a po drugie, występuje inflacja stopni itd.

    Ale / i są zalety dyskretyzacji, jak również zaobserwowano, ponieważ może zmniejszyć fiksację na stopniach ... do pewnego stopnia. Jasne, przypadki skrajne nadal stanowią problem, ale bez dyskretyzacji wszystko jest przypadkiem krytycznym.

    Sam
    2018-09-20 20:50:20 UTC
    view on stackexchange narkive permalink

    Wszystkie oceny są dyskretne. Nigdy żaden nauczyciel nie używał irracjonalnej liczby do oceny. Nigdy też nie kazałem profesorowi użyć więcej niż około 5000 dyskretnych „punktów” w ocenie. Innymi słowy, wszystkie możliwe stopnie z kursu można jednoznacznie opisać liczbami od 0 do 5000.

    Problem polega na tym, że 3392 z 5000 nie oddaje absolutnie nic na temat wiedzy ucznia, umiejętności lub poziomu wysiłku (dlaczego zależy nam na wysiłku, gdy ocenianie jest dla mnie nieszczęściem, ale to nie jest ważne).

    Oceny oznaczają dwie lub prawdopodobnie jedną rzecz. Po pierwsze, przedstawiają, jak uczeń (zdaniem oceniających) poradził sobie z innymi uczniami. Po drugie (i znacznie mniej ważne) oceny pokazują, czy uczeń może w przyszłości opanować dany materiał (związek między wynikami w nauce a wynikami w „prawdziwym życiu” jest w najlepszym przypadku słaby).

    Zatem biorąc pod uwagę cele i problemy związane z oceną, jedyne, co naprawdę możemy zrobić, to podzielić uczniów na kategorie i pozwolić, by żetony spadły tam, gdzie mogą. Ludzie bardzo źle radzą sobie z więcej niż 10 kategoriami / pojemnikami. Dlatego stworzyliśmy system z ~ 10 pojemnikami i przypisaliśmy do nich uczniów.

    Ben Norris
    2018-09-22 20:02:48 UTC
    view on stackexchange narkive permalink

    Krótka wersja:

    Większość odpowiedzi tutaj dotyczy schematu ABCDF w kontekście jakiegoś liczbowego lub procentowego schematu ocen. Jedną z zalet schematu ABCDF jest to, że umożliwia on ocenianie schematów oddzielonych od punktacji numerycznej i zamiast tego skupia się na opanowaniu określonych kluczowych treści. Ponieważ schemat ABCDF opiera się na powszechnie rozumianej filozofii osiągnięć uczniów, umożliwia porównanie wyników ocen uczniów z kursów, które wykorzystują liczbową lub procentową podstawę ocen z kursami, które mogą wykorzystywać biegłość, specyfikacje, wyniki lub inne nieliczbowe podstawy.

    Rozważ kurs z pięcioma celami nauczania, z których każdy obejmuje egzamin. Jeśli instruktor określi C jako średnią 70% z egzaminu, student może osiągnąć to 70% na wiele sposobów w spektrum pomiędzy następującymi skrajnościami:

    • Zdobycie średnio 87,5% na czterech egzaminach i zdobycie 0% na ostatnim (na przykład zdobycie 100%, 100%, 100%, 50% i 0%) oraz
    • zdobycie 70% na wszystkich pięciu egzaminach.

    Pierwsza skrajność może być kłopotliwa, jeśli student uzyska zero na egzaminie za cel dydaktyczny, który ma kluczowe znaczenie dla sukcesu na kolejnym kursie. W rzeczywistości student może łatwo zdobyć B, mimo że nie zdał egzaminu. Ten uczeń czułby się pewnie przygotowując się do następnego kursu, ale mógłby nie być lepiej przygotowany niż uczeń C lub D.

    Weźmy na przykład pod uwagę kurs chemii ogólnej I, który obejmuje następujące kluczowe tematy: struktura atomowa, struktura molekularna, roztwory, stochiometria i terochemia. Wszystkie pięć z tych tematów stanowi podstawę wielu innych kursów z chemii. A co, jeśli wydział chemii ustali, że najsilniejszym predyktorem oceny studenta z chemii ogólnej II nie jest ocena z przedmiotu z chemii ogólnej I, ale oceny z egzaminów ze stechiometrii i termochemii. Ich oceny na pozostałych trzech egzaminach nie są mocnymi predyktorami. Oznacza to, że uczeń, który uzyska ocenę C z Gen Chem I, ale dobrze sobie radzi na egzaminach ze stechiometrii i termochemii, ma większe szanse na uzyskanie A z Gen Chem II niż uczeń B, który zbombardował egzamin z termochemii.

    Program ABCDF umożliwia instruktorowi chemii ogólnej I ustawienie schematu ocen wymagającego zdania egzaminów ze stechiometrii i chemii, aby uzyskać ocenę C lub wyższą i zakwalifikować się do chemii ogólnej II:

    • Ocena A - zdaj egzaminy ze wszystkich pięciu celów dydaktycznych (wynik co najmniej 80% jest zaliczeniem) i zalicz projekt zaawansowany.
    • Ocena B - zdaj egzaminy ze wszystkich pięciu celów dydaktycznych (punktacja 80% lub więcej to przepustka) bez ukończenia projektu zaliczkowego; LUB spełnić kryteria oceny C ORAZ zdać projekt zaawansowany.
    • Egzaminy na ocenę C - zaliczają trzy lub cztery cele uczenia się (wynik 80% lub wyższy jest zaliczany): stechiometria, termochemia i każdy inny cel.
    • Ocena D - zalicza egzaminy z co najmniej trzech celów edukacyjnych (wynik co najmniej 80% oznacza zaliczenie), ale nie spełnia kryteriów oceny C; Innymi słowy, nie zdałeś egzaminu ze stechiometrii, termochemii lub obu.
    • Egzaminy na ocenę F - zaliczenie dla mniej niż trzech celów nauczania (wynik 80% lub więcej jest zaliczeniem).

    Jeśli instruktor daje uczniom szansę na ponowne podejście do egzaminu, który prawie zdali, np. przekroczenie pewnego progu wymaganego do oddania pracy domowej lub zaliczenie określonej liczby opcjonalnych quizów sprawdzających, praktycznie eliminujemy problem „ostrza noża”. W moim przypadku nigdy nie będzie ucznia, który ma 92,7% i dostanie A-, podczas gdy uczeń z 93,1% dostanie A. Uczniowie zdają egzaminy lub nie. Studenci zaliczają projekt zaawansowany lub nie. Ten specyfikacyjny styl stopniowania do pewnego stopnia naśladuje życie. Na stanowisku pracownik kończy projekt przed upływem terminu lub nie.

    Jednak nawet jeśli używam takiego schematu oceniania, nadal opieram swoją filozofię oceniania na powszechnym zrozumieniu, że ocena A jest zarezerwowana dla uczniów osiągających najlepsze wyniki, ocena B jest zarezerwowana dla studentów, którzy opanowali większość kursów, ocena C jest zarezerwowana dla studentów, którzy nauczyli się wystarczająco dużo na moim kursie, aby odnieść sukces na następnym kursie, ocena D jest zarezerwowana dla studentów, którzy nauczyli się czegoś na moim kursie, ale nie wystarczająco odnieść sukces na następnym kursie, a ocena F jest zarezerwowana dla studentów, dla których nie mam pewności, że nauczyli się czegoś na moim kursie. Ta filozofia sprawia, że ​​moje A jest porównywalne z A innego instruktora, pomimo radykalnie różnych sposobów określania tego A.

    W systemie, w którym wymagano ode mnie notowania oceny ucznia za pomocą pewnego rodzaju liczbowej oceny, czy to procentu lub percentyl, nigdy nie mógłbym przeprowadzić takiego schematu ocen jak ten. I bardziej podoba mi się ten schemat, ponieważ zmusza moich uczniów do skupienia się na nauce i opanowaniu kluczowego materiału zamiast grania w matematyczną grę z systemem punktowym.

    Roman Odaisky
    2018-09-20 22:19:36 UTC
    view on stackexchange narkive permalink

    System ocen od 0 do 100 jest problematyczny pod kilkoma względami.

    Na początek załóżmy, że prawdziwy poziom wiedzy ucznia można w znaczący sposób przedstawić za pomocą liczby w [0, 1] i że oceny są najlepszymi wysiłkami profesorów, aby oszacować tę liczbę. Funkcja jednego profesora skończy się wypukła w górę, podczas gdy inna będzie w dół, jeden przekształci 0,5 do 40%, podczas gdy drugi oceniłby tego samego ucznia na 60%.

    Nie żeby miało to nawet sens dla profesorów próbować zdefiniować taką funkcję w swoich umysłach. Jeśli problem został rozwiązany poprawnie, ale nieskuteczną metodą, która sugeruje, że student nie opanował bardziej odpowiedniego podejścia, czy jest to warte 100%? 90%? 80%? 84,2%? Jakie wagi zastosować do każdego z tysięcy możliwych czynników? Nie wspominając o tym, że ocena będzie prawdopodobnie dryfować, gdy profesor będzie przeglądać prace uczniów, ponieważ jest tak niejasny.

    Ponadto istnieją pewne przewrotne zachęty, takie jak np. rzeczy, które osobiście denerwują tego profesora, a większość z nich powstrzymałaby się od zamiany A w B z drobnych powodów.

    Dyskretny system można sformalizować znacznie łatwiej. Jak olimpiady matematyczne: rozwiązałeś to poprawnie? Otrzymujesz 7, bez wariancji.

    Specjaliści z większości dziedzin są dumni ze swojej zdolności do szacowania parametrów złożonych rzeczy, ale uczą się po badaniach (myślę, że Kahneman zacytował niektóre ze swoich słynnych and Slow) pokazuje, że wielu takich profesjonalistów konsekwentnie radzi sobie lepiej niż najprostsze metodologie podobne do wyniku APGAR.

    Bristol
    2018-09-24 19:19:54 UTC
    view on stackexchange narkive permalink

    Nie jestem ekspertem w dziedzinie systemu amerykańskiego, ale system brytyjski też to robił i nadal żyje w klasyfikacjach stopni lub „wyróżnieniach” (pierwszy, 2: 1, 2: 2, trzeci) .

    Pomysł, jak zawsze rozumiałem, jest taki, że

    • Ocena A pokazuje, że uczeń zrozumiał materiał przedmiotowy wyraźnie wykraczający poza to, czego był nauczany w kurs .
    • AB pokazuje, że student osiągnął to, czego chcieliśmy uczyć , nie mniej, ni mniej, ni więcej, czyli „zaznaczył wszystkie pola”.
    • AC pokazuje, że uczeń zrozumiał podstawowe pojęcia, ale nie dotarł tak daleko, jak się tego spodziewaliśmy .

    Tak więc dyskretne zespoły ocen opierają się na jakościowo różnym rozumieniu materiału przedmiotu. Jeden z naszych partnerów przemysłowych powiedział mi również, że są inżynierowie, którym możesz zgłosić problem, a oni go rozwiążą, oraz inżynierowie, którzy przyszli do ciebie z w pełni opracowanym rozwiązaniem, zanim zdałeś sobie sprawę (jak kierownik projektu), że gdzieś jest problem - i że to rozróżnienie wyjątkowo dobrze koreluje z uzyskaniem dyplomu drugiego lub pierwszego stopnia.

    Więc odpowiadam, że dyskretne pojemniki mają sens, jeśli ' są używane do kodowania informacji jakościowych, takich jak to, którzy uczniowie będą wykraczać poza to, czego ich uczysz, bez konieczności uniwersytet), aby nie zaznaczać na krzywej: proporcja pierwszych / „Jak” powinna być określona tylko przez jakość pracy i może (i robi) znacznie się różnić z roku na rok.

    To powiedziawszy, kilku pracodawców, dla których pisałem referencje, ma formularz online, w którym muszę wybrać, czy student, dla którego piszę referencje jest w

    • 1% najlepszych w swojej kohorcie
    • 5% najlepszych w swojej kohorcie
    • 20% najlepszych w swojej kohorcie
    • górne 50% swojej kohorty
    • nie należy do górnych 50% swojej kohorty

    i masz wyraźne wrażenie, że nie zapytaliby o to, gdyby w jakiś sposób nie wykorzystali tego do ustalenia, kogo zaprosić na rozmowę kwalifikacyjną, czy nie. Jako uniwersytet możesz więc spróbować nie „oceniać na krzywej”, ale pracodawcy będą na to reagować.

    Dyskretne pojemniki mogą pomóc w przekazywaniu informacji wykraczających poza twoją rangę w kohorcie, zwłaszcza w przypadku małych kohort, w których znaczenie poszczególnych rang zmienia się z roku na rok, jeśli są powiązane z określonymi standardami kompetencji i możesz zmieniać procent ocen „A”, które wystawiasz każdego roku.

    WGroleau
    2018-09-20 09:48:30 UTC
    view on stackexchange narkive permalink

    Myślę, że zależy to częściowo od charakteru zajęć. Jako (były) nauczyciel elektroniki mógłbym argumentować, że ABCDF jest zbyt szczegółowy:

    • Czy uczeń może zidentyfikować obcięty sygnał, czy nie?
    • Czy uczeń może zmierzyć napięcie na punkt testowy czy nie?

    Ale zajęcia plastyczne byłyby bardzo subiektywne.

    Ktoś mógłby wywnioskować odpowiedź na te pytania np. Z wyniku 80 vs 79?
    Osiągają cel lub nie.Dwie opcje.Niektóre rzeczy mogą być niewyraźne;niektóre rzeczy nie są.
    OK, ale masz dwa cele.Istnieją więc co najmniej cztery możliwe stopnie: ani jedno, ani drugie, nie może zidentyfikować, ale nie może zmierzyć, może zmierzyć, ale nie zidentyfikować, może zrobić jedno i drugie.Wydaje się, że nie odnosi się to bezpośrednio do żadnego rodzaju ocen.Krótko mówiąc, nie jestem pewien, jak ta odpowiedź ma się do pytania.
    Jeśli nie możesz zrobić obu, nie jesteś gotowy do pracy.
    Więc jesteś zwolennikiem oceny pozytywnej / negatywnej w tym scenariuszu?Myślę, że możesz zmienić tę odpowiedź, aby była znacznie jaśniejsza.
    Ta odpowiedź też mnie zdezorientowała.Czy w elektronice identyfikacja przerwanego sygnału jest jedynym celem całego kursu?
    Oczywiście nie.Chodzi o to, że są określone umiejętności, które musi posiadać technik.Pracodawca (marynarka) nie potrzebuje 75% technika.Innymi słowy, istnieje powód, dla którego na uniwersytetach można znaleźć nawet kursy zaliczające / niezaliczone.
    @Wgroleau Kto powiedział coś o marynarce wojennej?Jeśli dobrze cię rozumiem, proponujesz zajęcia z dwoma celami: identyfikacja obciętego sygnału i pomiar napięcia.Uczeń powinien otrzymać ocenę A iff, którą może wykonać oba, i F, jeśli nie może zrobić obu?Czy to jest poprawne?
    Pytanie brzmiało, czy ABCDF nie jest wystarczająco szczegółowy.Odpowiadam, że czasami jest to zbyt szczegółowe.


    To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 4.0, w ramach której jest rozpowszechniana.
    Loading...