Summarizing Question Answering

Here are the Python and JavaScript examples for text summarization using pgml SDK

Imports and Setup

Python

from pgml import Collection, Model, Splitter, Pipeline, Builtins  
from datasets import load_dataset
from dotenv import load_dotenv

JavaScript

const pgml = require("pgml");
require("dotenv").config();

The SDK and datasets are imported. Builtins are used for transformations.

Initialize Collection

Python

collection = Collection("squad_collection")

JavaScript

const collection = pgml.newCollection("my_javascript_sqa_collection");

A collection is created to hold text passages.

Create Pipeline

Python

model = Model()
splitter = Splitter()
pipeline = Pipeline("squadv1", model, splitter)  
await collection.add_pipeline(pipeline)

JavaScript

const pipeline = pgml.newPipeline(
  "my_javascript_sqa_pipeline",
  pgml.newModel(),
  pgml.newSplitter(), 
);

await collection.add_pipeline(pipeline);

A pipeline is created and added to the collection.

Upsert Documents

Python

data = load_dataset("squad")

documents = [
  {"id": ..., "text": ...}
  for r in data
]

await collection.upsert_documents(documents)

JavaScript

const documents = [
  {
    id: "...", 
    text: "...",
  }
];

await collection.upsert_documents(documents);

Text passages are upserted into the collection.

Query for Context

Python

results = await collection.query()
  .vector_recall(query, pipeline)
  .fetch_all()

context = results[0][1]

JavaScript

const queryResults = await collection
  .query()
  .vector_recall(query, pipeline) 
  .fetch_all();

const context = queryResults[0][1];

A vector search retrieves a relevant text passage.

Summarize Text

Python

builtins = Builtins()

summary = await builtins.transform(
  {"task": "summarization", 
   "model": "sshleifer/distilbart-cnn-12-6"},
  [context]
)

JavaScript

const builtins = pgml.newBuiltins();

const summary = await builtins.transform(
  {task: "summarization", 
   model: "sshleifer/distilbart-cnn-12-6"},
  [context]
);

The text is summarized using a pretrained model.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Summarizing Question Answering

Imports and Setup

Initialize Collection

Create Pipeline

Upsert Documents

Query for Context

Summarize Text

FilesExpand file tree

summarizing-question-answering.md

Latest commit

History

summarizing-question-answering.md

File metadata and controls

Summarizing Question Answering

Imports and Setup

Initialize Collection

Create Pipeline

Upsert Documents

Query for Context

Summarize Text