Re: то есть Вы допускаетеrandom_2005May 6 2011, 10:15:07 UTC
в принципе, да
если нет зависимости роста от пола, то в парах мальчики будут выше с вероятностью 1/2. Соотвественно, количество пар, где мальчики выше, распределено биномиально. Если же доля пар, где мальчики выше, будет существенно отлично от 1/2, это основание отвергнуть гипотезу
график позволяет увидеть, насколько точки симметрично расположены относительно прямой у=х. если, например, мы увидим, что большинство точек лежат выше прямой, это будет признак несостоятельности гипотезы
Единственная проблема может быть в том, что данных может оказаться слишком мало, чтобы отвергнуть гипотезу на требуемом уровне значимости, но здесь уже нужно считать для конкретных значений
Re: но какой смысл тогдаrandom_2005May 6 2011, 10:26:20 UTC
все пары - это все возможные пары м и д для данного класса? так делать нельзя, т.к. в этом случае события (м выше д) будут зависимы для разных пар. соотвественно распределение количества пар, где м выше д, уже не будет биномиальным
точнее так делать можно, но тогда придется работать с совершенно неизвестным распределением, а не хорошо изученным биномиальным. соотвественно встанет задача оценки для него доверительных интервалов, что теоретически может оказаться сложной задачей. всегда проще работать с независимыми наблюдениями - для них лучше работают все теоремы, в частности предельные
а какие, собственно говоря, величины независимы в этой ситуации? (когда внутри каждого класса берётся случайное паросочетание) - вроде бы тут ниоткуда биномиальное распределение (ни для общего числа пар, где мальчик выше, ни для числа пар в каждом классе) не получается.
Оно получилось бы, если бы бралось не случайное паросочетание, а случайная выборка из множества пар (возможно, с повторениями) - но тоже только внутри одного класса, а не для общего числа.
Событие N: в паре N мальчик выше девочки. Если пары набраны случайно (мальчик случайно из множества мальчиков, девочка случайно из множества девочек), то данные события независимы и при нулевой гипотезе имеют вероятность 1/2 Случайная величина N = Индикатору События N, она принимает значения 0 и 1 с вероятностью 1/2 Сумма всех таких случайных величин (их конечно число, условно 10) - это случайная величиная имеющая биномиальное распределение
Сумма считается по конкретной выборке. В нашем случае (вы изначально спрашивали про один класс) вся выборка взята из одного класса. Это конечно ставит вопрос о том, насколько данная выборка репрезентативна для всей генеральной совокупности. Ответ здесь имхо такой, что выборка не репрезентативна для всей совокупности мальчиков и девочек, но она более-менее репрезентативна (т.е. может быть использована на практике) для м и д данного возраста (и региона).
сумма берётся по одной выборке, то число успехов имеет биномиальное распределение (независимые бернуллиевские испытания), причём вероятность успеха в каждом испытании легко вычислить по имеющимся данным (доля пар, где первый рост больше второго). Какой же смысл явно проделывать эти испытания?!
если нет зависимости роста от пола, то в парах мальчики будут выше с вероятностью 1/2. Соотвественно, количество пар, где мальчики выше, распределено биномиально. Если же доля пар, где мальчики выше, будет существенно отлично от 1/2, это основание отвергнуть гипотезу
график позволяет увидеть, насколько точки симметрично расположены относительно прямой у=х. если, например, мы увидим, что большинство точек лежат выше прямой, это будет признак несостоятельности гипотезы
Единственная проблема может быть в том, что данных может оказаться слишком мало, чтобы отвергнуть гипотезу на требуемом уровне значимости, но здесь уже нужно считать для конкретных значений
Reply
Reply
так делать нельзя, т.к. в этом случае события (м выше д) будут зависимы для разных пар. соотвественно распределение количества пар, где м выше д, уже не будет биномиальным
точнее так делать можно, но тогда придется работать с совершенно неизвестным распределением, а не хорошо изученным биномиальным. соотвественно встанет задача оценки для него доверительных интервалов, что теоретически может оказаться сложной задачей. всегда проще работать с независимыми наблюдениями - для них лучше работают все теоремы, в частности предельные
Reply
Оно получилось бы, если бы бралось не случайное паросочетание, а случайная выборка из множества пар (возможно, с повторениями) - но тоже только внутри одного класса, а не для общего числа.
Reply
Случайная величина N = Индикатору События N, она принимает значения 0 и 1 с вероятностью 1/2
Сумма всех таких случайных величин (их конечно число, условно 10) - это случайная величиная имеющая биномиальное распределение
Reply
Reply
Reply
Reply
Reply
Leave a comment