Unit Tests

Actions

Unit Tests

Actions

Loading...
Loading

unit_tests.yml

3,100 workflow runs

Filters bugfix; add metrics and filter to logged sample (#2517) Unit Tests #3779: Commit 5680a2e pushed by baberabb

November 28, 2024 07:33

6m 24s main

main

November 28, 2024 07:33

6m 24s

mlx Model (loglikelihood & generate_until) Unit Tests #3778: Pull request #1902 synchronize by chimezie

November 28, 2024 03:21

Action required chimezie:mlx

chimezie:mlx

November 28, 2024 03:21

Action required

Filters bugfix; add metrics and filter to logged sample Unit Tests #3777: Pull request #2517 synchronize by baberabb

November 27, 2024 17:22

6m 35s filters

filters

November 27, 2024 17:22

6m 35s

Filters bugfix; add metrics and filter to logged sample Unit Tests #3776: Pull request #2517 synchronize by baberabb

November 27, 2024 17:16

6m 12s filters

filters

November 27, 2024 17:16

6m 12s

Filters bugfix; add metrics and filter to logged sample Unit Tests #3775: Pull request #2517 synchronize by baberabb

November 27, 2024 17:02

6m 31s filters

filters

November 27, 2024 17:02

6m 31s

Filters bugfix; add metrics and filter to logged sample Unit Tests #3774: Pull request #2517 synchronize by baberabb

November 27, 2024 17:01

6m 20s filters

filters

November 27, 2024 17:01

6m 20s

Update citation links (Zenodo and DOI) to 0.4.6 Unit Tests #3773: Pull request #2391 synchronize by LSinev

November 27, 2024 08:58

6m 13s LSinev:patch-1

LSinev:patch-1

November 27, 2024 08:58

6m 13s

Update citation links (Zenodo and DOI) to 0.4.6 Unit Tests #3772: Pull request #2391 synchronize by LSinev

November 27, 2024 08:57

6m 29s LSinev:patch-1

LSinev:patch-1

November 27, 2024 08:57

6m 29s

Add GigaChat API Unit Tests #3771: Pull request #2495 synchronize by seldereyy

November 27, 2024 08:50

Action required seldereyy:models/gigachat_llms

seldereyy:models/gigachat_llms

November 27, 2024 08:50

Action required

Add --examples Argument for Fine-Grained Task Evaluation in lm-evaluation-harness. This feature is the first step towards efficient multi-prompt evaluation with PromptEval [1,2] Unit Tests #3770: Pull request #2520 synchronize by mirianfsilva

November 26, 2024 19:51

Action required mirianfsilva:examples-arg

mirianfsilva:examples-arg

November 26, 2024 19:51

Action required

November 26, 2024 19:47

Action required mirianfsilva:examples-arg

mirianfsilva:examples-arg

November 26, 2024 19:47

Action required

Score tasks (#2452) Unit Tests #3768: Commit 0ef7548 pushed by baberabb

November 26, 2024 14:54

6m 21s main

main

November 26, 2024 14:54

6m 21s

mlx Model (loglikelihood & generate_until) Unit Tests #3767: Pull request #1902 synchronize by baberabb

November 26, 2024 14:48

5m 50s chimezie:mlx

chimezie:mlx

November 26, 2024 14:48

5m 50s

mlx Model (loglikelihood & generate_until) Unit Tests #3766: Pull request #1902 synchronize by baberabb

November 26, 2024 14:38

6m 32s chimezie:mlx

chimezie:mlx

November 26, 2024 14:38

6m 32s

mlx Model (loglikelihood & generate_until) Unit Tests #3765: Pull request #1902 synchronize by baberabb

November 26, 2024 14:34

2m 19s chimezie:mlx

chimezie:mlx

November 26, 2024 14:34

2m 19s

Score tasks Unit Tests #3764: Pull request #2452 synchronize by rimashahbazyan

November 26, 2024 13:09

6m 26s rimashahbazyan:score_tasks

rimashahbazyan:score_tasks

November 26, 2024 13:09

6m 26s

make utility function to handle until Unit Tests #3763: Pull request #2518 synchronize by baberabb

November 26, 2024 10:49

5m 55s stop_seq

stop_seq

November 26, 2024 10:49

5m 55s

make utility function to handle until Unit Tests #3762: Pull request #2518 opened by baberabb

November 26, 2024 10:39

6m 59s stop_seq

stop_seq

November 26, 2024 10:39

6m 59s

Filters bugfix; add metrics and filter to logged sample Unit Tests #3761: Pull request #2517 synchronize by baberabb

November 26, 2024 09:47

5m 55s filters

filters

November 26, 2024 09:47

5m 55s

Filters bugfix; add metrics and filter to logged sample Unit Tests #3760: Pull request #2517 opened by baberabb

November 26, 2024 08:52

6m 16s filters

filters

November 26, 2024 08:52

6m 16s

max_length not used Unit Tests #3759: Pull request #2515 opened by lintangsutawika

November 25, 2024 16:53

7m 59s lintangsutawika-patch-5

lintangsutawika-patch-5

November 25, 2024 16:53

7m 59s

Update Unitxt task to use locally installed unitxt and not download Unitxt code from Huggingface Unit Tests #3758: Pull request #2514 synchronize by yoavkatz

November 25, 2024 16:04

6m 10s yoavkatz:main

yoavkatz:main

November 25, 2024 16:04

6m 10s

Update Unitxt task to use locally installed unitxt and not download Unitxt code from Huggingface Unit Tests #3757: Pull request #2514 opened by yoavkatz

November 25, 2024 12:59

6m 42s yoavkatz:main

yoavkatz:main

November 25, 2024 12:59

6m 42s

mlx Model (loglikelihood & generate_until) Unit Tests #3756: Pull request #1902 synchronize by chimezie

November 25, 2024 09:49

Action required chimezie:mlx

chimezie:mlx

November 25, 2024 09:49

Action required

Added small fix to split by eos_token_id before decoding Unit Tests #3755: Pull request #2512 opened by EtashGuha

November 24, 2024 02:26

Action required EtashGuha:etashg/tokenize_fix

EtashGuha:etashg/tokenize_fix

November 24, 2024 02:26

Action required

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Actions

Workflows

Management

Unit Tests

Actions

Loading...
Loading

Create status badge

Filter by Event

Sorry, something went wrong.

Sorry, something went wrong.

No matching events.

Filter by Status

Sorry, something went wrong.

Sorry, something went wrong.

No matching statuses.

Filter by Branch

Sorry, something went wrong.

Sorry, something went wrong.

No matching branches.

Filter by Actor

Sorry, something went wrong.

Sorry, something went wrong.

No matching users.

Actions: EleutherAI/lm-evaluation-harness

Actions

Unit Tests Unit Tests Actions Loading... Loading Sorry, something went wrong.

Unit Tests

Unit Tests

Actions

Loading...
Loading