Ecosyste.ms: Packages

An open API service providing package, version and dependency metadata of many open source software ecosystems and registries.

pypi.org "evaluation" keyword

Top 8.8% on pypi.org

coconut-develop 3.1.0.post0.dev11 💰

Simple, elegant, Pythonic functional programming.
655 versions - Latest release: 19 days ago - 2 dependent repositories - 3.58 thousand downloads last month - 3,951 stars on GitHub - 2 maintainers

Top 8.2% on pypi.org

torcheval-nightly 2024.5.15

A library for providing a simple interface to create new metrics and an easy-to-use toolkit for m...
481 versions - Latest release: about 4 hours ago - 2 dependent packages - 1 dependent repositories - 9.82 thousand downloads last month - 156 stars on GitHub - 1 maintainer

Top 8.2% on pypi.org

langfuse 2.31.0

A client library for accessing langfuse
321 versions - Latest release: about 15 hours ago - 17 dependent packages - 1 dependent repositories - 225 thousand downloads last month - 2,823 stars on GitHub - 1 maintainer

Top 8.1% on pypi.org

enoslib 9.2.0

226 versions - Latest release: about 1 month ago - 1 dependent package - 3 dependent repositories - 1.18 thousand downloads last month - 3 maintainers

Top 3.1% on pypi.org

langsmith 0.1.58

Client library to connect to the LangSmith LLM Tracing and Evaluation Platform.
167 versions - Latest release: about 1 hour ago - 86 dependent packages - 2,234 dependent repositories - 8.17 million downloads last month - 217 stars on GitHub - 1 maintainer

Top 6.7% on pypi.org

agenta 0.14.8

The SDK for agenta is an open-source LLMOps platform.
114 versions - Latest release: 2 days ago - 2 dependent repositories - 3.76 thousand downloads last month - 575 stars on GitHub - 1 maintainer

Top 3.5% on pypi.org

evo 1.28.0

Python package for the evaluation of odometry and SLAM
100 versions - Latest release: 6 days ago - 18 dependent repositories - 94.4 thousand downloads last month - 3,023 stars on GitHub - 1 maintainer

chainforge 0.2.6

A Visual Programming Environment for Prompt Engineering
87 versions - Latest release: 9 months ago - 1.11 thousand downloads last month - 2,018 stars on GitHub - 1 maintainer

Top 9.7% on pypi.org

acconeer-exptool 7.10.0

Acconeer Exploration Tool
83 versions - Latest release: 22 days ago - 1 dependent repositories - 1.79 thousand downloads last month - 155 stars on GitHub - 4 maintainers

kolena-client 1.18.0

Client for Kolena's machine learning testing platform.
70 versions - Latest release: 1 day ago - 1.91 thousand downloads last month - 38 stars on GitHub - 1 maintainer

Top 1.3% on pypi.org

sacrebleu 2.4.2

Hassle-free computation of shareable, comparable, and reproducible BLEU, chrF, and TER scores
69 versions - Latest release: about 1 month ago - 96 dependent packages - 4,263 dependent repositories - 1.88 million downloads last month - 972 stars on GitHub - 3 maintainers

topiceval 3.0.0.dev1

Topic Model User Evaluation
69 versions - Latest release: over 6 years ago - 1 dependent repositories - 9 downloads last month - 1 maintainer

kolena 1.18.0

Client for Kolena's machine learning testing platform.
65 versions - Latest release: 1 day ago - 1 dependent repositories - 7.63 thousand downloads last month - 38 stars on GitHub - 1 maintainer

redlite 0.2.0

LLM testing on steroids
58 versions - Latest release: 5 days ago - 488 downloads last month - 0 stars on GitHub - 1 maintainer

panoptica 0.6.5

Panoptic Quality (PQ) computation for binary masks.
53 versions - Latest release: 27 days ago - 1 dependent repositories - 324 downloads last month - 12 stars on GitHub - 1 maintainer

zenoml 0.6.4

Interactive Evaluation Framework for Machine Learning
51 versions - Latest release: 10 months ago - 1 dependent package - 1 dependent repositories - 577 downloads last month - 208 stars on GitHub - 1 maintainer

promptmodel 0.1.19

Prompt & model versioning on the cloud, built for developers.
50 versions - Latest release: 6 days ago - 347 downloads last month - 11 stars on GitHub - 2 maintainers

pycyclops 0.2.8

Framework for healthcare ML implementation
50 versions - Latest release: about 2 hours ago - 1 dependent package - 742 downloads last month - 62 stars on GitHub - 1 maintainer

Top 2.2% on pypi.org

bob 12.0.0

Bob is a free signal-processing and machine learning toolbox originally developed by the Biometri...
49 versions - Latest release: 11 months ago - 12 dependent packages - 38 dependent repositories - 1.61 thousand downloads last month - 8 maintainers

athina 1.2.17

Python SDK to configure and run evaluations for your LLM-based application
48 versions - Latest release: 1 day ago - 1.16 thousand downloads last month - 135 stars on GitHub - 1 maintainer

Top 9.7% on pypi.org

uptrain 0.7.0

UpTrain - tool to evaluate LLM applications on aspects like factual accuracy, response quality, r...
48 versions - Latest release: 12 days ago - 2 dependent packages - 1 dependent repositories - 5.39 thousand downloads last month - 2,015 stars on GitHub - 2 maintainers

trajectopy-core 3.1.0

Trajectory Evaluation in Python
46 versions - Latest release: 7 days ago - 2 dependent packages - 883 downloads last month - 1 stars on GitHub - 1 maintainer

antgo 0.1.24

machine learning experiment platform
46 versions - Latest release: 10 months ago - 1 dependent repositories - 167 downloads last month - 16 stars on GitHub - 1 maintainer

python-grid5000 1.2.4

A python wrapper for the GitLab API.
45 versions - Latest release: over 1 year ago - 1 dependent package - 1 dependent repositories - 416 downloads last month - 2,162 stars on GitHub - 2 maintainers

Top 5.3% on pypi.org

ranx 0.3.19

ranx: A Blazing-Fast Python Library for Ranking Evaluation, Comparison, and Fusion
45 versions - Latest release: 6 months ago - 4 dependent packages - 7 dependent repositories - 13.2 thousand downloads last month - 348 stars on GitHub - 1 maintainer

Top 2.3% on pypi.org

pycm 0.9.5 💰

Multi-class confusion matrix library in Python
44 versions - Latest release: almost 6 years ago - 4 dependent packages - 50 dependent repositories - 45.4 thousand downloads last month - 1,430 stars on GitHub - 3 maintainers

Top 1.1% on pypi.org

configspace 0.7.2

Creation and manipulation of parameter configuration spaces for automated algorithm configuration...
43 versions - Latest release: 10 months ago - 31 dependent packages - 56 dependent repositories - 108 thousand downloads last month - 186 stars on GitHub - 2 maintainers

trajectopy 2.0.14

Trajectory Evaluation in Python
43 versions - Latest release: 7 days ago - 838 downloads last month - 21 stars on GitHub - 1 maintainer

Top 3.6% on pypi.org

coconut 3.1.0 💰

Simple, elegant, Pythonic functional programming.
41 versions - Latest release: 2 months ago - 3 dependent packages - 22 dependent repositories - 2.81 thousand downloads last month - 3,951 stars on GitHub - 1 maintainer

caserecommender 1.1.1

A recommender systems framework for Python
39 versions - Latest release: over 2 years ago - 1 dependent repositories - 184 downloads last month - 454 stars on GitHub - 1 maintainer

tmtoolkit 0.12.0

Text Mining and Topic Modeling Toolkit
35 versions - Latest release: about 1 year ago - 2 dependent packages - 10 dependent repositories - 2.96 thousand downloads last month - 12 stars on GitHub - 2 maintainers

alpaca-eval 0.6.2

AlpacaEval : An Automatic Evaluator of Instruction-following Models
33 versions - Latest release: 26 days ago - 2 dependent packages - 7.19 thousand downloads last month - 1,062 stars on GitHub - 3 maintainers

Top 7.3% on pypi.org

bob.bio.base 8.0.0

Tools for running biometric recognition experiments
32 versions - Latest release: 11 months ago - 7 dependent packages - 5 dependent repositories - 220 downloads last month - 10 maintainers

Top 6.5% on pypi.org

table-evaluator 1.6.1

A package to evaluate how close a synthetic data set is to real data.
31 versions - Latest release: 9 months ago - 3 dependent packages - 5 dependent repositories - 1.79 thousand downloads last month - 74 stars on GitHub - 1 maintainer

waffle-hub 0.3.1

Waffle hub
31 versions - Latest release: 4 months ago - 192 downloads last month - 39 stars on GitHub - 1 maintainer

pycond 2020.10.10

Lightweight Condition Parsing and Building of Evaluation Expressions
31 versions - Latest release: over 3 years ago - 2 dependent packages - 3 dependent repositories - 556 downloads last month - 23 stars on GitHub - 1 maintainer

Top 9.9% on pypi.org

xlcalculator 0.5.0

Converts MS Excel formulas to Python and evaluates them.
28 versions - Latest release: over 1 year ago - 1 dependent repositories - 12.1 thousand downloads last month - 105 stars on GitHub - 2 maintainers

lares 0.0.32

LARES: vaLidation, evAluation and REliability Solutions
28 versions - Latest release: 9 months ago - 194 downloads last month - 1 maintainer

autorag 0.1.11

Automatically Evaluate RAG pipelines with your own data. Find optimal structure for new RAG product.
26 versions - Latest release: 1 day ago - 1.15 thousand downloads last month - 515 stars on GitHub - 1 maintainer

vision-evaluation 0.2.14

Evaluation metric codes for various vision tasks.
25 versions - Latest release: about 1 year ago - 2 dependent repositories - 288 downloads last month - 34 stars on GitHub - 2 maintainers

Top 8.6% on pypi.org

evalidate 2.0.2

Validation and secure evaluation of untrusted python expressions
25 versions - Latest release: 10 months ago - 3 dependent packages - 6 dependent repositories - 16.4 thousand downloads last month - 19 stars on GitHub - 1 maintainer

bob.bio.face 8.0.0

Tools for running face recognition experiments
24 versions - Latest release: 11 months ago - 3 dependent packages - 2 dependent repositories - 56 downloads last month - 10 maintainers

Top 7.7% on pypi.org

insight 1.0

A python library for monitoring, comparing and extracting insights from data.
23 versions - Latest release: about 1 month ago - 5 dependent repositories - 6.59 thousand downloads last month - 12 stars on GitHub - 1 maintainer

errant-prep 3.2.3

The ERRor ANnotation Toolkit (ERRANT). Automatically extract and classify edits in parall...
23 versions - Latest release: 4 months ago - 49 downloads last month - 402 stars on GitHub - 1 maintainer

bob.bio.spear 5.0.0

23 versions - Latest release: 11 months ago - 1 dependent package - 3 dependent repositories - 111 downloads last month - 10 maintainers

dyff-schema 0.5.3

Data models for the Dyff AI auditing platform.
22 versions - Latest release: 5 days ago - 4 dependent packages - 1.27 thousand downloads last month - 0 stars on GitLab.com - 5 maintainers

Top 7.9% on pypi.org

jury 2.2.4

Evaluation toolkit for neural language generation.
22 versions - Latest release: 11 months ago - 1 dependent package - 2 dependent repositories - 604 downloads last month - 178 stars on GitHub - 1 maintainer

fast-eval 1.1.0

Simple tool to provide automation to assessment processes.
22 versions - Latest release: about 3 years ago - 1 dependent repositories - 23 downloads last month - 0 stars on GitHub - 1 maintainer

phasellm 0.0.21

Wrappers for common large language models (LLMs) with support for evaluation.
21 versions - Latest release: 3 months ago - 1 dependent package - 1 dependent repositories - 414 downloads last month - 1 maintainer

orbis-eval 2.3.5

An Extendable Evaluation Pipeline for Named Entity Drill-Down Analysis
21 versions - Latest release: about 2 years ago - 1 dependent repositories - 135 downloads last month - 8 stars on GitHub - 3 maintainers

dyff 0.18.0

Meta-package to install the local SDK for the Dyff AI auditing platform.
20 versions - Latest release: 5 days ago - 398 downloads last month - 5 maintainers

ml3m 0.0.20

Evaluting your LLM performance
20 versions - Latest release: 8 months ago - 163 downloads last month - 37,327 stars on GitHub - 1 maintainer

Top 9.9% on pypi.org

django-access 0.1.2b2

Django-Access - the application introducing dynamic evaluation-based instance-level (row-level) a...
20 versions - Latest release: 4 months ago - 1 dependent package - 4 dependent repositories - 666 downloads last month - 76 stars on GitHub - 1 maintainer

bob.bio.gmm 4.0.1

Tools for running biometric recognition experiments using GMM-based approximation
20 versions - Latest release: over 2 years ago - 2 dependent repositories - 55 downloads last month - 10 maintainers

Top 5.1% on pypi.org

errant 3.0.0

The ERRor ANnotation Toolkit (ERRANT). Automatically extract and classify edits in parallel sente...
19 versions - Latest release: 6 months ago - 13 dependent repositories - 3.08 thousand downloads last month - 402 stars on GitHub - 4 maintainers

xturing 0.1.8

Fine-tuning, evaluation and data generation for LLMs
19 versions - Latest release: 8 months ago - 321 downloads last month - 1 maintainer

Top 4.9% on pypi.org

rexmex 0.1.3

A General Purpose Recommender Metrics Library for Fair Evaluation.
19 versions - Latest release: over 1 year ago - 1 dependent package - 9 dependent repositories - 1.85 thousand downloads last month - 275 stars on GitHub - 5 maintainers

Top 1.8% on pypi.org

simpleeval 0.9.13 💰

A simple, safe single expression evaluator library.
18 versions - Latest release: about 1 year ago - 59 dependent packages - 290 dependent repositories - 1.22 million downloads last month - 424 stars on GitHub - 1 maintainer

enos-kubernetes 2.0.0

18 versions - Latest release: about 2 years ago - 1 dependent repositories - 112 downloads last month - 2 maintainers

Top 8.7% on pypi.org

verif 1.3.0

A verification program for meteorological forecasts and observations
17 versions - Latest release: 2 months ago - 1 dependent package - 5 dependent repositories - 481 downloads last month - 81 stars on GitHub - 1 maintainer

replay-rec 0.16.0

RecSys Library
17 versions - Latest release: 2 months ago - 1 dependent package - 1 dependent repositories - 4.05 thousand downloads last month - 125 stars on GitHub - 1 maintainer

inginious 0.8.7

An intelligent grader that allows secured and automated testing of code made by students.
17 versions - Latest release: about 1 year ago - 7 dependent repositories - 41 downloads last month - 187 stars on GitHub - 2 maintainers

pyevaldata 1.6.0

Python module to evaluate experimental data
17 versions - Latest release: 5 months ago - 1 dependent repositories - 120 downloads last month - 7 stars on GitHub - 1 maintainer

bob.bio.vein 5.0.0

Vein Recognition Library
16 versions - Latest release: 11 months ago - 1 dependent package - 76 downloads last month - 1 maintainer

Top 1.2% on pypi.org

evaluate 0.4.2

HuggingFace community-driven open-source library of evaluation
15 versions - Latest release: 15 days ago - 222 dependent packages - 2,474 dependent repositories - 2.58 million downloads last month - 1,762 stars on GitHub - 3 maintainers

synthesized-datasets 1.7

Publically available datasets for benchmarking and evaluation.
15 versions - Latest release: 2 months ago - 3 dependent packages - 7.72 thousand downloads last month - 1 stars on GitHub - 1 maintainer

multivar-horner 3.1.0 💰

python package implementing a multivariate Horner scheme for efficiently evaluating multivariate ...
14 versions - Latest release: about 1 year ago - 1 dependent repositories - 138 downloads last month - 26 stars on GitHub - 1 maintainer

semevalplatform 0.0.10

Semantic Evaluation Platform
14 versions - Latest release: over 1 year ago - 1 dependent repositories - 79 downloads last month - 0 stars on GitHub - 1 maintainer

bob.fusion.base 0.1.5

Score fusion in biometric and pad experiments
13 versions - Latest release: 11 months ago - 71 downloads last month - 1 maintainer

Top 8.9% on pypi.org

codebleu 0.6.1

Unofficial CodeBLEU implementation that supports Linux, MacOS and Windows available on PyPI.
13 versions - Latest release: about 19 hours ago - 3 dependent repositories - 1.85 thousand downloads last month - 31 stars on GitHub - 1 maintainer

audio-degrader 1.3.1

Tool to introduce controlled degradations to audio
13 versions - Latest release: over 3 years ago - 120 downloads last month - 49 stars on GitHub - 1 maintainer

evaldet 0.4.0

Evaluation for Detection and Tracking
13 versions - Latest release: 11 months ago - 1 dependent repositories - 103 downloads last month - 2 stars on GitHub - 1 maintainer

mobile-env 2.0.1

mobile-env: An Open Environment for Autonomous Coordination in Wireless Mobile Networks
13 versions - Latest release: 10 months ago - 1 dependent repositories - 147 downloads last month - 79 stars on GitHub - 1 maintainer

jurity 2.0.1

fairness and evaluation library
12 versions - Latest release: 4 months ago - 1 dependent package - 4 dependent repositories - 829 downloads last month - 35 stars on GitHub - 5 maintainers

inspire 1.0.9

Helper library to participate in the INSPIRE challenge
12 versions - Latest release: about 9 years ago - 4 dependent repositories - 36 downloads last month - 2 stars on GitHub - 2 maintainers

dyff-audit 0.3.1

Audit tools for the Dyff AI auditing platform.
12 versions - Latest release: 21 days ago - 1 dependent package - 355 downloads last month - 0 stars on GitLab.com - 5 maintainers

clayrs 0.5.1

Complexly represent contents, build recommender systems, evaluate them. All in one place!
12 versions - Latest release: 11 months ago - 52 downloads last month - 32 stars on GitHub - 1 maintainer

gradgpad 2.1.0

gradgpad
12 versions - Latest release: over 1 year ago - 1 dependent repositories - 85 downloads last month - 13 stars on GitHub - 1 maintainer

fiddler-auditor 0.0.5

Auditing large language models made easy.
12 versions - Latest release: 6 months ago - 1 dependent repositories - 980 downloads last month - 138 stars on GitHub - 1 maintainer

dyff-client 0.5.0

Python client for the Dyff AI auditing platform.
12 versions - Latest release: 5 days ago - 2 dependent packages - 769 downloads last month - 0 stars on GitLab.com - 5 maintainers

Top 8.5% on pypi.org

hydrotools.nwis-client 3.3.1

A convenient interface to the USGS NWIS Instantaneous Values (IV) REST Service API.
12 versions - Latest release: 12 months ago - 7 dependent repositories - 885 downloads last month - 49 stars on GitHub - 3 maintainers

langcheck 0.7.1

Simple, Pythonic building blocks to evaluate LLM-based applications
12 versions - Latest release: 7 days ago - 2.71 thousand downloads last month - 140 stars on GitHub - 3 maintainers

fair-test 0.1.4

A library to define and publish FAIR metrics tests APIs complying with the FAIRMetrics working gr...
12 versions - Latest release: over 1 year ago - 1 dependent repositories - 83 downloads last month - 7 stars on GitHub - 1 maintainer

alpaca-farm 0.2.0

An automatic evaluator for instruction-following language models. Human-validated, high-quality, ...
11 versions - Latest release: 3 months ago - 172 downloads last month - 1,062 stars on GitHub - 1 maintainer

process-tracing 0.1.0a1

ptrace based process tracing utilities for python
11 versions - Latest release: 8 months ago - 1 dependent repositories - 191 downloads last month - 2 stars on GitHub - 1 maintainer

fstring 1.7.4

Working with strings has never been prettier.
11 versions - Latest release: almost 6 years ago - 5 dependent repositories - 12.5 thousand downloads last month - 8 stars on GitHub - 1 maintainer

audmetric 1.2.1

Evaluate machine-learning models
11 versions - Latest release: 3 months ago - 2 dependent packages - 2 dependent repositories - 1.56 thousand downloads last month - 1 stars on GitHub - 1 maintainer

tieval 0.1.2

A framework for evaluation and development of temporal-aware models.
11 versions - Latest release: 2 months ago - 1 dependent repositories - 72 downloads last month - 14 stars on GitHub - 1 maintainer

opencompass 0.2.4

A comprehensive toolkit for large model evaluation
10 versions - Latest release: 22 days ago - 248 downloads last month - 2,659 stars on GitHub - 1 maintainer

pyspark-easy 1.5

Makes pyspark dataframe exploration easy
10 versions - Latest release: about 3 years ago - 1 dependent repositories - 38 downloads last month - 0 stars on GitHub - 1 maintainer

Top 10.0% on pypi.org

hydrotools.metrics 1.3.3

Variety of standard model evaluation metrics.
10 versions - Latest release: almost 2 years ago - 4 dependent repositories - 847 downloads last month - 49 stars on GitHub - 3 maintainers

boridge 0.1.10

A library of functions for selecting features using bootstrapped ridge regression
10 versions - Latest release: about 4 years ago - 1 dependent repositories - 96 downloads last month - 1 stars on GitHub - 1 maintainer

factscorelite 1.3.0

FactScore (Fine-grained atomic evaluation of factual precision in long form text generation) comp...
10 versions - Latest release: 23 days ago - 882 downloads last month - 0 stars on GitHub - 1 maintainer

Top 6.3% on pypi.org

pymia 0.3.2

A Python package for data handling and evaluation in deep learning-based medical image analysis.
10 versions - Latest release: about 2 years ago - 9 dependent repositories - 745 downloads last month - 57 stars on GitHub - 2 maintainers

Top 5.2% on pypi.org

keras-metrics 1.1.0

Metrics for Keras model evaluation
9 versions - Latest release: about 5 years ago - 41 dependent repositories - 2.77 thousand downloads last month - 166 stars on GitHub - 1 maintainer

reseval 0.1.6

Reproducible Subjective Evaluation
9 versions - Latest release: 2 months ago - 1 dependent package - 1 dependent repositories - 78 downloads last month - 53 stars on GitHub - 1 maintainer

Top 1.8% on pypi.org

motmetrics 1.4.0

Metrics for multiple object tracker benchmarking.
9 versions - Latest release: over 1 year ago - 13 dependent packages - 398 dependent repositories - 127 thousand downloads last month - 1,326 stars on GitHub - 1 maintainer

er-evaluation 2.3.0 💰

An End-to-End Evaluation Framework for Entity Resolution Systems.
9 versions - Latest release: 6 months ago - 1 dependent package - 1 dependent repositories - 103 downloads last month - 9 stars on GitHub - 1 maintainer

bob.ip.dlib 1.0.9

Bob interface for dlib functions
9 versions - Latest release: over 3 years ago - 12 downloads last month - 1 maintainer

Top 3.5% on pypi.org

rliable 1.0.8

rliable: Reliable evaluation on reinforcement learning and machine learning benchmarks.
9 versions - Latest release: almost 2 years ago - 6 dependent packages - 15 dependent repositories - 5.77 thousand downloads last month - 689 stars on GitHub - 1 maintainer

Related Keywords

python 63 machine-learning 45 metrics 37 nlp 24 evaluation-metrics 22 ai 20 llm 19 deep-learning 19 bob 17 biometric recognition 16 data-science 15 benchmark 14 validation 13 evaluation-framework 13 simulation 12 forecasting 12 pytorch 12 large-language-models 12 verification 11 ml 11 modeling 11 machine learning 11 pandas 11 llmops 10 natural language processing 10 learning 10 observations 10 noaa 10 hydrology 10 NLP 9 data 9 prompt-engineering 9 testing 9 ranking 9 machine 8 precision 8 classification 8 recall 7 information retrieval 7 comparison 7 monitoring 7 expression 7 ML 6 detection 6 evaluate 6 framework 6 LLM 6 object-detection 6 langchain 6 language 6 clustering 6 computational linguistics 6 lab automation 5 hacktoberfest 5 rag 5 data-analysis 5 llms 5 segmentation 5 openai 5 django 5 python3 5 optimization 5 information-retrieval 5 natural-language-processing 5 metric 5 model 5 audit 5 research 5 experiments 5 visualisation 5 trec_eval 5 configuration 5 robots 5 deep learning 5 statistics 5 training 5 observability 4 benchmarking 4 box 4 analysis 4 assessment 4 trajectory 4 vision 4 recommendation 4 dataset 4 safety 4 recommender-system 4 algorithm 4 library 4 machine translation 4 laboratory 4 instruments 4 serial interface 4 scikit-learn 4 computer-vision 4 datasets 4 mathematics 4 pipeline 4 artificial-intelligence 4 lazy 4