Как да изчислим точността на данните

Making sense of string theory | Brian Greene (Юли 2024)

Making sense of string theory | Brian Greene (Юли 2024)

Съдържание:

Anonim

Прецизността на данните е един от най-важните съображения при провеждането на научен или статистически анализ. Обикновено объркана с еднакво важна концепция за точност, аналогия на софтуера за стрелички, описана от Хавайския университет, демонстрира връзката: точните данни се изчисляват средно на равни очаквани резултати, докато точните данни се сближават заедно, дори и да не са близки до очакваните резултати. Според Dartmouth College точността е измерване на възпроизводимостта на набор от резултати. Прецизността в наборите от данни е важна концепция дори и в областта на технологиите, показани от Кенет Е. Фоут и Доналд Хюбнер с Университета на Тексас-Остин в анализа на географските информационни системи. Изчисляването на прецизността е доста просто, макар и донякъде субективно упражнение.

Елементи, от които се нуждаете

  • Графично представяне на набор от данни

  • Информация за съответните единици, изразена в данните

  • Минимално допустима граница на грешка в експеримента

Разработване на визуално представяне на точки от данни, като например разпръснат участък. Много просто визуално представяне включва нанасяне на съответните зависими и независими стойности на променливи за всяка точка от данни в декартова координатна система.

Оценете групирането на точки от данни и потърсете модели. Точните данни се проявяват в клъстери от точки от данни, което показва, че подобни входни променливи съответстват на подобни изходни променливи.

Приложете информация за мерните единици, използвани за събиране на данни, за да определите средното разстояние между точките за данни. За да се определи разстоянието между точките на графиката, може да се използва просто измерване на линейка, след което да се преобразува, използвайки произволна, удобна скала, която съответства на мерните единици, използвани за генериране на данните. Това ще позволи да се изчисли точността на данните в сравнение един с друг, като се вземе средната стойност на разстоянията.

Сравнете минималната допустима грешка, позволена в експеримента, и средната точност на данните, за да определите относителната обща точност на експеримента. Различните видове експерименти ще имат по-голяма или по-малка толерантност към грешки: инженерният проект вероятно ще изисква прецизност до много малки единици, докато социален експеримент вероятно ще понася повече отклонения.

Съвети

  • Опитайте се да оцените вероятната единична скала, преди да създадете графично представяне на точките от данни. Това ще направи по-лесно визуално оценяване на прецизността, за да се идентифицират области с особено голяма точност или неточност.

    Ясни модели на данни, които се срещат във визуалното представяне, са много показателни за прецизността и повторяемостта на експеримента. Продължаващите експерименти трябва да добавят допълнителни данни в точни клъстери, близки до вече съществуващите.

Внимание

Не бъркайте с точност с точност. Ако целта на експеримента е да се постигне средна изходна стойност на дава за всички входове, и това се постига чрез усреднени стойности, вариращи от -12 до 14, това е малко вероятно да бъде точно измерване, въпреки че може да е точно. Точното измерване може да доведе до групиране на данни около 17 точки, което би било неточно, но прецизно и следователно предсказуемо.