Как LOD-выражения работают в Tableau?



Выражения уровня детализации Tableau представляют собой элегантный и эффективный способ ответить на вопросы, включающие несколько уровней детализации в одной визуализации.

Цель любого инструмента бизнес-аналитики - дать Анализ данных лучший поток. Если кто-то, как профессионал, сталкивается с трудностями при использовании инструмента при решении проблемы, состояние потока нарушается. Одна из частых причин этой проблемы - необходимость работать с данными, которые были агрегированы в разные Уровень детализации в таблице (LOD) .

Размещение Tableau на вершине стопки в шестой раз подряд в Magic Quadrant компании Gartner определенно что-то говорит о ее спросе на рынке. Это, наверное, лучшее время для .





Этот блог поможет вам понять выражения LOD и обсудит следующие темы:



Tableau LOD: Зачем вам LOD?

При анализе данных часто возникают вопросы. Эти вопросы часто просто задать, но на них сложно ответить. Часто они звучат примерно так:

питон __init__

Вопросы в таблице - Таблица LOD - EdurekaЧтобы ответить на эти типы вопросов, был введен новый синтаксис под названием Уровень детализации в Таблице 9.0. Этот новый синтаксис и упрощает, и расширяет язык вычислений Tableau, позволяя напрямую решать эти вопросы.

Таблица LOD: Что такое LOD?

Выражения уровня детализации представляют собой элегантный и эффективный способ ответить на вопросы, включающие несколько уровней детализации в одной визуализации.



Уровень детализации в табличных выражениях или выражения LOD позволяют вычислять значения на уровне источника данных и уровне визуализации. Однако выражения LOD дают вам еще больший контроль над уровнем детализации, который вы хотите вычислить. Их можно выполнять в более гранулированный уровень (ВКЛЮЧИТЬ расчет), a менее гранулированный уровень (EXCLUDE Calculation) или полностью независимый мягкий l (ФИКСИРОВАННЫЙ расчет).

Таблица LOD: Выражения уровня строки и уровня просмотра

Уровень строки

В Таблице выражения, ссылающиеся на неагрегированный столбцы источника данных вычисляются для каждой строки в базовой таблице. В этом случае размерность выражения равна уровень строки . Пример выражения на уровне строки:

[Продажи] / [Прибыль]

Этот расчет будет оцениваться в каждой строке базы данных. Значение продаж в каждой строке будет разделено на значение прибыли в этой строке, в результате чего появится новый столбец с результатом умножения (коэффициент прибыли).

Если вы создаете расчет с этим определением, сохраните его под именем [ProfitRatio], а затем перетащите его из Панель данных на полку, Tableau обычно объединяет вычисленное поле для представления:

SUM [ProfitRatio]

Уровень просмотра

Напротив, выражения, ссылающиеся на агрегированный столбцы источника данных вычисляются с размерностью, определяемой измерениями в представлении. В этом случае размерностью выражения является уровень просмотра. Пример выражения уровня представления:

SUM (Продажи) / SUM (Прибыль)

Если вы перетащите это вычисление на полку (или введите его прямо на полке в качестве специального вычисления), Tableau заключит его в Функция AGG :

AGG (СУММ (продажи) / СУММ (прибыль))

Это то, что известно как Агрегированный расчет .

Таблица LOD: Агрегация и выражения LOD

Выражение LOD грубее, чем уровень детализации представления

Выражение имеет более грубый уровень детализации, чем представление, когда оно ссылается на подмножество размеров в представлении.

Например, для представления, содержащего размеры [Категория] и [Сегмент], вы можете создать уровень детализации в Tableau, который использует только одно из следующих измерений:

{ИСПРАВЛЕНО [сегмент]: SUM ([продажи])}

В этом случае выражение имеет более грубый уровень детализации, чем представление. Его значения основаны на одном измерении ([Сегмент]), тогда как представление основывается на двух измерениях ([Сегмент] и [Категория]).

В результате использование уровня детализации выражения в представлении приводит к репликации определенных значений, то есть к появляются несколько раз .

Выражение LOD лучше, чем уровень детализации представления

Выражение имеет более высокий уровень детализации, чем представление, когда оно ссылается на надмножество размеров в представлении.

Когда вы используете такое выражение в представлении, Tableau будет агрегировать результаты до уровня представления. Например, следующий уровень детализации в Tableau ссылается на два измерения:

{ИСПРАВЛЕНО [сегмент], [категория]: SUM ([продажи])}

Когда это выражение используется в представлении с уровнем детализации только [Сегмент], значения должны быть агрегированы . Вот что вы увидите, если перетащите это выражение на полку:

СРЕДНЕЕ ([{ИСПРАВЛЕНО [сегмент]], [Категория]]: СУММ ([Продажи]])}])

An агрегирование (в данном случае среднее значение) автоматически присваивается Tableau. При необходимости вы можете изменить агрегирование.

Добавление выражения LOD в представление

Агрегируется или реплицируется выражение уровня детализации в таблице в представлении, определяется тип выражения и детализация .

  • Выражения INCLUDE будут иметь либо тот же уровень детализации, что и представление, либо более высокий уровень детализации, чем представление. Следовательно, значения никогда не будут воспроизведены.
  • ФИКСИРОВАННЫЕ выражения могут иметь более высокий уровень детализации, чем представление, более грубый уровень детализации или такой же уровень детализации. Необходимость агрегирования результатов ФИКСИРОВАННОГО уровня детализации зависит от того, какие измерения находятся в представлении.
  • Выражения EXCLUDE всегда заставляют реплицированные значения появляться в представлении. Когда вычисления, включающие выражения с уровнем детализации EXCLUDE, помещаются на полку, Tableau по умолчанию принимает значение Агрегация ATTR в отличие от SUM или AVG, чтобы указать, что выражение на самом деле не агрегируется и что изменение агрегации не повлияет на представление.

Выражения уровня детализации всегда автоматически объединяются в агрегат, когда они добавляются на полку в представлении, если только они не используются в качестве измерений.

Таблица LOD: Фильтры и выражения LOD

Изображение здесь изображаетпорядок выполнения фильтров сверху вниз.Текст справа показывает, где в этой последовательности вычисляются выражения LOD.

Фильтры извлечения (отмечены оранжевым) актуальны только в том случае, если вы создаете извлечение таблицы из источника данных. Фильтры табличных вычислений (темно-синие) применяются после выполнения вычислений и поэтому скрывают метки, не отфильтровывая базовые данные, используемые в вычислениях.

фреймворк, управляемый данными в примере selenium webdriver

ФИКСИРОВАННЫЕ вычисления применяются перед фильтрами измерений, поэтому, если вы не продвинете поля на полке «Фильтр» для повышения производительности представления с помощью контекстных фильтров, они будут проигнорированы.

Таблица LOD: Типы выражений LOD

ВКЛЮЧИТЬ расчет

INCLUDE вычисляет значения, используя указанные измерения в дополнение к любым измерениям в представлении. Этот уровень детализации наиболее полезен при включении измерения, которого нет в представлении.

Например: {ВКЛЮЧИТЬ [Имя клиента]: SUM ([Продажи])}

ИСКЛЮЧИТЬ расчет

EXCLUDE явно удаляет измерения из выражения, то есть вычитает размеры из уровня детализации представления. Этот уровень детализации в Таблице наиболее полезен для исключения измерения в представлении.

Например: {EXCLUDE [Region]: SUM ([Sales])}

ФИКСИРОВАННЫЙ расчет

FIXED вычисляет значения с использованием указанных измерений без ссылки на уровень детализации представления, то есть без ссылки на какие-либо другие измерения в представлении. Этот уровень детализации выражения также игнорирует все фильтры в представлении, кроме контекстных фильтров, фильтров источника данных и фильтров извлечения.

Например: {ИСПРАВЛЕНО [Регион]: SUM ([Продажи])}

Таблица LOD: Создание выражений LOD

Синтаксис выражения LOD

Уровень детализации имеет следующую структуру:

ВКЛЮЧАЮТ

Шаг 1. Настройте визуализацию

  1. Откройте рабочий стол Tableau и подключитесь к Образец-Супермаркет сохраненный источник данных.
  2. Перейдите к новому листу.
  3. От Данные в области 'Размеры' перетащите Область, край к Столбцы Полка.
  4. От Данные на панели 'Меры' перетащите Продажи к Рядов Полка. Появится столбиковая диаграмма, показывающая сумму продаж для каждого региона.

Шаг 2: Создайте выражение LOD

Вместо суммы всех продаж по региону, возможно, вы захотите также увидеть средние продажи на одного покупателя по каждому региону. Для этого вы можете использовать выражение LOD.

  1. Выбрать Анализ > Создать вычисляемое поле.
  2. В открывшемся редакторе расчетов выполните следующие действия:
    • Назовите расчет «Продажи на клиента».
    • Введите следующее выражение LOD:

      {ВКЛЮЧИТЬ [Имя клиента]: SUM ([Продажи])}

  3. Когда закончите, нажмите ОК. Вновь созданное выражение уровня детализации добавляется на панель «Данные» в разделе «Меры».

Шаг 3. Используйте выражение LOD в визуализации

  1. От Данные на панели 'Меры' перетащите Продажи на клиента к Рядов полку и поместите ее слева от СУММ (Продажи).
  2. На полке Строки щелкните правой кнопкой мыши Продажи на клиента и выберите Мера (сумма) > Средний. Теперь вы можете видеть как сумму всех продаж, так и средние продажи на одного покупателя для каждого региона. Например, вы можете видеть, что в Центральном регионе продажи составили примерно 500 000 долларов США со средней продажей для каждого покупателя примерно 800 долларов США .

Таблица LOD: Источники данных, поддерживающие выражения LOD

Источник данных Поддерживается / не поддерживается
Actian VectorwiseНе поддерживается.
Amazon EMR Hadoop HiveПоддерживается Hive начиная с версии 0.13.
Amazon RedshiftПоддерживается.
База данных AsterПоддерживается версия 4.5 и выше.
Клодера ХадупПоддерживается Hive начиная с версии 0.13.
Клодера ИмпалаПоддерживается Impala 1.2.2 и новее.
Кубы (многомерные источники данных)Не поддерживается.
DataStax EnterpriseНе поддерживается.
EXASOLПоддерживается.
Жар-птицаПоддерживается версия 2.0 и выше.
Общий ODBCОграничено. Зависит от источника данных.
Google Big QueryПоддерживается для Standard SQL, но не для Legacy.
IBM DB2Поддерживается версия 8.1 и выше.
MarkLogicПоддерживается версия 7.0 и выше.
SAP HANAПоддерживается.
SAP Sybase ASEПоддерживается.
SAP Sybase IQПоддерживается версия 15.1 и выше.
Spark SQLПоддерживается.
SplunkНе поддерживается.
Таблица извлечения данныхПоддерживается.
ТерадатаПоддерживается.
VerticaПоддерживается версия 6.1 и выше.
Microsoft AccessНе поддерживается.
Подключения на основе Microsoft JetНе поддерживается.
Hortonworks Hadoop HiveПоддерживается Hive начиная с версии 0.13.

В версии 1.1 HIVE выражения LOD, которые производят перекрестные соединения, ненадежны.

IBM BigInsightsПоддерживается.
Microsoft SQL ServerПоддерживается SQL Server 2005 и более поздних версий.
MySQLПоддерживается.
IBM PDA (Netezza)Поддерживается версия 7.0 и выше.
OracleПоддерживается версия 9i и выше.
Actian Matrix (ParAccel)Поддерживается версия 3.1 и выше.
Pivotal GreenplumПоддерживается версия 3.1 и выше.
PostgreSQLПоддерживается версия 7.0 и выше.
Прогресс OpenEdgeПоддерживается.

Таблица LOD: Табличные вычисления против LOD

Выражения уровня детализации не являются новой формой табличных вычислений. Хотя они могут заменить многие табличные вычисления, их главная цель - открыть новые возможности.Выражения уровня детализации и вычисления таблиц работают по-разному.

Табличные расчеты Выражения LOD
Табличные вычисления производятся Результаты запроса .Выражения уровня детализации генерируются как часть запроса к базовый источник данных . Они выражаются как вложенный выбор, то есть в зависимости от производительности СУБД.
Табличные вычисления могут дают только результаты равные или менее детализированные чем указанный LOD.LOD может дать результаты независимо от указанного LOD .
Измерения, управляющие операциями с таблицей, отделены от синтаксиса вычислений.Измерения, которые управляют операциями выражения LOD: встроено в выражение сам.
Табличные вычисления используются как агрегированные показатели .Выражения уровня детализации могут использоваться в других конструкциях.
Фильтры в табличных вычислениях действуют как СКРЫВАТЬ .Фильтры на уровне детализации действуют как ИСКЛЮЧИТЬ .

Таблица LOD: Ограничения LOD

Ниже приведены ограничения, которые применяются к выражениям уровня детализации.

  • Выражения уровня детализации, которые ссылаются на меры с плавающей запятой, имеют тенденцию вести себя ненадежным образом при использовании в представлении, которое требует сравнения значений в выражении.
  • LOD не отображается на странице источника данных.
  • При ссылке на параметр в объявлении размерности всегда используйте имя параметра, а не значение параметра.
  • При смешивании данных связывающее поле из первичного источника данных должно быть в представлении, прежде чем вы сможете использовать выражение с уровнем детализации из вторичного источника данных.

Кроме того, некоторые источники данных имеют ограничения по сложности. Tableau не отключит вычисления для этих баз данных, но возможны ошибки запроса, если вычисления станут слишком сложными.